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(54) Humanes und murines Semaphorin L 

(57) Humanes Semaphorin L(H-SemaL) und korre- 
spondierende Semaphorine in anderen Spezies. 

Gegenstand der Erfindung sind neuen Semapho- 
rine. die sich durch eine besondere DomSnenstruktur 
auszeichnen und deren Derivate, NuWeins^uren (DNA. 
RNA, cDNA). die fur diese Semaphorine kodieren und 
deren Derivate sowie die Venwendung derselben. 

Gegenstand der vorliegenden Erfindung sind Sem- 
aphorine mit einer neuen, bisher nicht bekannten und 
nicht zu erwartenden DomSnenstruktur, denen eine bio- 
chemische Funktion im Immunsystem zukommt 
(immunmodulierende Semaphorine). Die erfindungs- 
gemd3en Semaphorine werden als Semaphorine vom 
Typ L (SemaL) bezeichnet. Sie enthalten ein N-termina- 
les Signalpeptid, eine charakteristische Sema-Domane 
und im C-terminalen Bereich des Proteins eine Imnnun- 
globuiin-ahnliche Domane und eine hydrophobe 
DomSne, die eine potentielle Transmembrandomane 
darsteilt. 
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Beschreibung 

Humanes Semaphain L(H-SemaL) und korrespondierende Semaphorine in anderen Spezies. 

Gegenstand der Erfindung sind neue Semaphorine. die sich durch eine besondere Domanenstruktur auszeichnen 
und deren Derivate, Nukleinsauren (DNA, RNA. cDNA). die furdiese Semaphorine kodieren undderen Derivate sowie 
die Herstellung und Verwendung derselben. 

Semaphorine wurden erstmals von Koldokin {Kolodkin et al. (1993) Cell 75:1389-1399} als Mitglieder einer konser- 
vierten Genfamilie beschrieben. 

Inzwischen wurden die Gene bzw. Teile der Gene weiterer Semaphorine kloniert und leilweise charakterisiert. Bis- 
her waren insgesamt 5 humane (H-Sema III. H-Sema V. H-Sema IV, H-SemaB und H-SemaE) {Koldokin et al. (1993); 
Roche et al. (1996) Onkogene 12:1289-1297; Sekido et al. (1996) Proc. Natl. Acad. Sci. USA 93:4120-4125; Xiang et 
al. (1996) Genomics 32:39-48; Hall et al. (1996) Proc. Natl. Acad. Sci. USA 39:11780-11785; Yamada et al. (1997) 
(GenBank Zuordnungs-Nr. AB000220)}, 8 murine (Gene der Maus; M-Sema A bis M-SemaH) {Puschel et al. (1995) 
Neuron 14:941-948; Messerschmidt et al. (1995) Neuron 14:949-959; Inlgaki et al. (1995) FEBS Letters 370:269-272; 
Adams et al. (1996) Mech. Dev. 57:33-45; Christensen et al. (1996) (Genbank Zuordnungs-Nr Z80941. Z93948)}, 5 
galline (Huhn) (Collapsin-1 bis -5) {Luo et al. (1993); Luo et al. (1995) Neuron 14:1 131-1 140}, und Gene von Ratte (R- 
Sema III) {Giger et al. (1996) J. Comp. Neurol. 375:378-392}. Zebrafisch. Insekten (Fruchtfliege (Drosophila melanoga- 
ster: D-Sema I und D-Sema II), K§fer (Trit)olium confusum: T-Sema I). Grasshupfer (Schistocerca americana: G-Sema 
i)) {Kolodkin et al. (1993)}, und Nematoden (C.elegans: Ce-Sema) {Roy et al. (1994) (GenBank Zuordnungs-Nr. 
U15667)) bekannt. Weiterhin besitzen zwei Poxviren (Vaccinia (ORF-A39) und Variola {ORFA39-homolog)) {Kolodkin 
et al. (1993)) SG'/^ie der Aicelaphine Herpesvirus Typ 1 (AHV-1) (AHV-Sema) {Ensser und Fleckenstein (1995) Gen. 
Virol. 76:1063-1067} zu Semaphorinen homologe Gene. 

Einen Uberblick uber die bisher identifizierten Semaphorine in verschiedenen Spezies gibt Tabelle 1. In Tabelle 1 
sind die Namen der Semaphorine (Spalte 1), die venwendeten Synonyme (Spalte 2). die Spezies aus der das jeweilige 
Semaphorin isoiiert wurde (Sparte 3) sowie. soweit bekannt, Daten zur Dom^nenstruktur des kodierten Proteins und 
zur chromosomalen Lokalisation (Spalte 4 in Tabelle 1). die Zuordnungsnummer unter der die Sequenz des Gens in 
Gendatenbanken. z.B. in einer EST (expressed sequence tags) Datenbank. EMBL (European Molecular Biology Labo- 
ratory. Heidelberg) Oder NCBI (National Center for Biotechnology Information, f^aryland. USA) gespeichert ist urxl die 
entsprechende Referenz unter der diese Daten publiziert wurden (Spalte 5 in Tabelle 1). angegeben. 

Alle Genprodukte (kodierte Semaphorine) der bisher bekannten Semaphorin Gene weisen ein N-terminales 
Signalpeptid auf, an dessen C-terminalem Ende sich eine charakteristische Sema-Domane mit einer Ldnge von etwa 
450 bis 500 Aminos^uren befindet Innerhalb der Sema-Domane finden sich stark konservierte AminosSuremotive und 
eine Anzahl hochkonservierter Cysteinreste. Die Genprodukte (Semaphorine) unterscheiden sich in den auf die Sema- 
Dom^ne folgenden C-terminalen Sequenzen, die aus einer Oder mehreren Domanen aufgebaut sind. Sie weisen bei- 
sptelsweise in diesen C-terminalen AminosSuresequenzen Transmembrandomanen (TM), Immunoglobulin-Shnliche 
Dom§nen (Ig) (konstanter Teil des Immunoglobulins), zytoplasmatische Sequenzen (CP), Prozessierungssignale (P) 
(beispielsweise mit der Konsensussequenz (RXR), wobei R fur die AminosSure Arginin und X fur eine beliebige Ami- 
nosSure steht) und/oder hydrophile C-Termini (HPC) auf. Auf der Basis der unterschiedlichen Domanenstruktur im C- 
Terminus lassen sich die bisher bekannten Semaphorine in 5 verschiedene Untergruppen einteilen (I bis V): 

t Sezerniert, ohne weitere Domane (z.B. ORF-A49) 

II Ig Sezerniert (ohne Transmembrandomane) (z.B. AHV-Sema) 

III Ig. TM, CP Mennbranverankert mit zytoplasmatischer Sequenz (z.B. CD100) 

IV Ig. (P). HPCSezerniert mit hydrophilem C-Terminus (z.B. H-Sema III. M-SemaD. Collapsin-1) 

V Ig, TM, CP Membranverankert mit C-terminalem 7 Thrombospondin-Motiv (z.B. M-SennaF und G) 

Ein Rezeptor Oder extrazelluiarer Ligand fur Semaphorine wurde bisher nicht beschrieben. Im Zusamrnenhang mit 
Semaphorin-vermittelten Effekten wurden intrazelluiare. heterotrimere GTP-bindende Proteinkomplexe beschrieben. 
Als ein Bestandteil dieser Proteinkomplexe wurden bei Huhnern sogenannte CRMP-Proteine (Collapsin response 
mediator protein) identif iziert, welche vermutlich Bestandteil der Semaphorin-induzierten intrazelluiaren Signalkaskade 
sind (Goshima et al. (1995) Nalure 376: 509-514). Das CRMP62 beispielsweise besitz: Homologie zu unc-33, einem 
fiir das gerichtete Axonwachstum essentiellen Nemaloden-Protein. Ein humanes Protein mit 98% Aminosaure-ldentrtat 
zu CRMP62 ist ebenfalls bekannt (Hamajima et al. (1996) Gene 180: 157-163. In Ratten wurden ebenfalls mehrere 
CRMP-verwandte Gene beschrieben (Wang et al. (1996) Neurosci. 16: 6197-6207. 

Die sezernierten oder transmembrahen Semaphorine vermitteln repulsive Signale fur wachsende Nervenknospen. 
Sie spielen eine Rolle bei der Entwicklung des zentralen Nervensystems (ZNS) und werden vor allem in Muskel- und 
Nervengewebe exprimiert (Koldokin et al. (1993); Luo et al. (1993) Cell 75:217-227. 

Aufier im ZNS konnte eine deutliche Expression von M-SemaG auch auf Zellen des lymphatischen und hamato- 
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poetischen Systems beobachtet werden. im Gegensatz zum nahe verwandten M-SemaF {Furuyima et al. (1996) J 
Biol. Chem. 271 : 33376-33381). 

Kurzlich wurden zwei weitere humane Semaphorine identifiziert, H-Sema IV und H-Sema V und zwar in einer 
Region auf Chromosom 3p21.3. deren Deletion mit verschiedenen Formen von Bronchial karzinomen assoziiert ist H- 
Sema IV {Roche et al. (1996). Xiang et al. (1996). Sekido et al. (1996)} ist auf Aminosaureebene etwa zu 50% identisch 
mit M-SemaE, wShrend H-Sema V {Sekido et al. (1 996)} das direkte Homolog zu M-Sema-A ist (86% Aminosaureiden- 
m\). Da diese Gene (H-Sema IV und V) im Rahmen von DNA-Sequenzierungs-Projekten der deletierten 3p21.3 Loci 
gefunden wurden, ist die komplexe Intron-Exon-Struktur dieser beiden Gene bekannt. Die beiden Gene werden in ver- 
schiedenen neuronalen und nicht neuronalen Geweben exprimiert. 

Ebenfalls erst vor kurzem wurde das zelluiare Oberliachenmolekul CD100 (human), exprimiert und induziert auf 
aktivierten T-Zel!en. als Semaphorin identifiziert (ebenfalls in Tabelle 1 aufgefuhrt). Es unterstutzt die Interaktion mrt B- 
Zellen uber den Rezeptor CD40 und den entsprechenden Liganden CD40L. CD 100 ist ein membranverankertes Gly- 
koprotein-Dimer von 1 50kd (Kilodalton). Es wurde eine Assoziation des intrazytoplasmatischen C-Terminus von CD 100 
mit einer noch unbekannten Kinase beschrieben {Hall et al. (1996)}. Damit ist CD100 das erste und bisher einzige 
Semaphorin, dessen Expression in Zellen des Immunsystems nachgewiesen werden konnte. 

Unter der Fragestellung "Transformierende Gene von Rhadinoviren" wurde das komplette Genom des Alcelaphi- 
nen Herpesvirus Typ 1 (AHV-1) kloniert und sequenziert {Ensser et al. (1995)}. AHV-1 ist der Erreger des bosartigen 
Katarrhalfiebers, einer mit einem tymphoproliferativen Syndrom einhergehenden, meistfataien Erkrankung verschiede- 
ner Wiederkauer Bei der Analyse wurde an einem Ende des viralen Genoms ein offener Leserahmen mit entfernter, 
aber signifikanter Homologie zu einem Gen von Vacciniavirus (ORF-A39 entspricht VAC-A39 in Ensser et al. (1995)) J.* 
Gen. Virol. 76:1063-1067). welches der Genfamilie der Semaphorine zugerechnet wurde, gefunden. Wahrend das 
AHV-1 Semaphorin (AHV-Sema) eine gut konservierte Semaphorin-Struktur besitzt. sind die Poxvirus-Gene (ORF-A39 
und ORF-A39-homolog. siehe Tabelle 1) C-terminal verkurzt. d.h. bei ihnen ist die konservierte Sema-Dom^ne nur 
unvollstandig vorhanden. 

Ein Datenbankvergleich des gefundenen AHV-Sema mit dbEST (EST (expressed sequence tags)-Datenbank (db)) 
lieferte jeweils 2 EST-Sequenzen von 2 unabh^ngigen cDNA-Klonen aus humaner Plazenta (Zuordnungsnummern 
H02902. H03806 (Klon 151129). Zuordnungsnummern R33439 und R33537 (Klon 135941)). Diese wiesen deutlich 
hohere Homologie zum AHV-1 Semaphorin auf, als zu den bis dahin beschriebenen neuronalen Semaphorinen. 

Gegenstand der vorliegenden Erlindung sind Semaphorine mit einer neuen, bisher nicht bekannten und nicht zu 
erwartenden Dom^nenstruktur, denen eine biochemische Funktion im Immunsystem zukommt (immunmodulierende 
Semaphorine). Die erfindungsgem^3en Semaphorine werden als Semaphorine vom Typ L (SemaL) bezeichnet. Sie 
enthalten ein N-termina!es Signalpeptid. eine charakteristische Sema-DomSne und im C-terminalen Bereich des Pro- 
teins eine Immunglobulinahnliche DomSne und eine hydrophobe Domane, die eine potentielle TransmembrandomSne 
darstelit 

Die Aminosaure-Sequenz des Signalpeptids kann weniger als 70, vorzugsweise weniger als 60 AminosSuren und 
mehr als 20, vorzugsweise mehr als 30 Aminos^uren aufweisen, besonders bevorzugt ist eine LSnge von etwa 40 bis 
50 Aminosauren. In einer speziellen Ausfuhrungsform der Erfindung hat das Signalpeptid eine LSnge von 44 Amino- 
sauren, d.h. zwischen den Aminos^uren 44 und 45 bef indet sich eine Spaltstelle fur eine Signalpeptidase. 

Die Sema-Dpmane kann eine Lange von 300 bis 700 Oder mehr. vorzugsweise yon etwa 400 bis 600 Aminosduren 
aufweisen. Bevorzugt sind Sema-DomSnen mit einer Lange von 450 bis 550 Aminosauren, vorzugsweise von etwa 500 
Aminos^uren. In einer besonderen Ausfuhrungsform der Erfindung schlteBt sich die Sema-Oomane an das Signalpep- 
tid an, wobei sich die Sema-DomSne vorzugsweise bis zur Aminosaure 545 erstreckt. 

Die Imrnunglobulin-ahnliche DomSne kann eine L^nge von etwa 30 bis 110 Oder mehr Aminos^uren aufweisen, 
bevorzugt sind LSngen zwischen 50 und 90, besonders bevorzugt etwa 70 Aminos^uren, 

Die Transrnembrandomane kann eine L^nge von etwa 10 bis 35, vorzugsweise von etwa 15 bis 30, besonders 
bevorzugt von etwa 20 bis 25 AminosSuren aufweisen. 

Gegenstand der Erlindung sind Semaphorine vom Typ L aus verschieden Spezies, insbesondere aus Wirbettieren. 
beispielsweise aus Vogeln und/oder Fischen. vorzugsweise aus Saugetieren. beispielsweise aus Primaten. Ratte, Kan- 
ninchen, Hund. Katze, Schaf. Ziege, Kuh, Pferd, Schwein, besonders bevorzugt aus Mensch und Maus. Gegenstarxi 
der Erfindung sind auch entsprechende Semaphorine aus Mikroorganismen, insbesondere aus pathogenen Mikroor- 
ganismen, beispielsweise aus Bakterien, Hefen und/oder Viren. z.B. aus Retrovtren, insbesondere aus humanpathoge- 
nen Mikroorganismen. 

Eine Ausfuhrungsform der Erlindung ist ein entsprechendes humanes Semaphorin (H-SemaL). das ein Signalpep- 
tid, eine Sema-Domane, eine Imrnunglobulin-ahnliche DomSne und eine TransmembrandomSne aufweist Eine spezi- 
elle Ausfuhrungsform ist das Semaphorin, das durch die AminosSuresequenz gem^B Tabelle 4 gegeben ist. 

Eine weitere Ausfuhrungsform der Erfindung sind korrespondlerende Semaphorine in anderen Spezies, die im 
Bereich der Sema-Dom^ne eine Aminos^ureidentitat grCBer als 40 %. vazugsweise grOBer 50 %. besonders bevor- 
zugt groBer 60 % im Bezug auf die Sema-DomSne von H-SemaL (AminosSuren 45 bis 545 der Sequenz in Tabelle 4) 
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aufweisen. Aus naher verwandten Spezies (z.B. Primaten, Maus) kOnnendie korrespondierenden Semaphorine durch- 
aus Aminosaureidentitaten groBer als 70%, vorzugsweise grC(3er als 80 %, besonders bevorzugt groBer als 90 % auf- 
weisen. Prozentuale Homologien k6nnen beispielsweise mil dem Programm GAP (GCG Programm-Paket, Genetic 
Computer Group (1991)) bestimmt bzw. berechnet werden. 

Eine derartige Ausfuhrungsform der Erfindung ist ein korrespondierendes Semaphorin der Maus (murines Sema- 
phorin (M-SemaL)). Beispielsweise enthait dieses die partielle Aminos^uresequenz gemSB Tabelle 5 (murines Sema- 
phorin (M-SemaL)). 

Die Erfindung betrifft auch korrespondierende Semaphorine, die eine AminosSureidentitat (uber die GesamtlSnge 
der AminosSuresequenz des Protein betrachtet) von nur etwa 15 bis 20% bei wenig venwandten Spezies (phylogene- 
tisch weit voneinander entfernt). vorzugsweise 25 bis 30%, besonders bevazugt 35 bis 40 % oder eine hOhere kJentitat 
im Bezug auf die gesamte Aminosauresequenz von H-SemaL gem^B Tabelle 4 aufweisen. 

Die Gene, die fur Semaphorine von Typ L kodieren, weisen eine komplexe Exon-lntron-Struktur auf. Diese Gene 
konnen beispielsweise zwischen 10 und 20 Exons, vorzugsweise etwa 1 1 bis 18, besonders bevorzugt 12 bis 16 Exons 
und eine entsprechende Anzahl von Introns aufweisen. Sie konnen aber auch die gleiche Anzahl Exons und Introns 
aufweisen wie das Gen von H-SemaL (13 oder 15 Exons, vorzugsweise 14 Exons). Eine besondere Ausfuhrungsform 
der Erfindung betrifft das Gen von H-SemaL Dieses Gen hat vorzugsweise eine L§nge von 8888 bis 10000 oder mehr 
Nukleotiden. Das humane Semaphorin-Gen enth§lt vorzugsweise die Nukleotid-Sequenz. die in Tabelle 1 4 gegeben ist 
Oder die NuMeotidsequenz, die in der Datenbank GenBank® unter der Zugangsnummer AF030697 hinterlegt wurde. 
Diese Nukleotidsequenzen enthalten mindestens 13 Introns. Daruber hinaus weist das humane Semaphorin-Gen am 
5'-Ende einen zusatzlichen Sequenzbereich auf. Dieser Bereich enth^lt gegebenfalis weitere kodierende und nichko- 
diererxle Sequenzen, z.B. ein ckjer zwei weitere introns bzw. Exons.. 

Die Versuche zur chromosomalen Lokalisation des humanen Semaphorins vom Typ L ergaben, daB das entspre- 
chende Gen an Position 1 5q22.3-23 lokalisiert ist Entsprechend wurde das Gen fur M-SemaL an Position 9A3.3-B loka- 
lisiert. 

Als Folge der komplexen Intron-Exon Struktur kann das Primartranskript der Semaphorin mRNA unterschiedlich 
gespliced werden, wodurch unterschiedliche Splicevarianten der Semaphorine entstehen. Die aus diesen Splicevarian- 
ten translatierten Proteine sind Derivate der erfindungsgemSBen Semaphorine. Sie entsprechen in ihrer Aminosaure- 
sequenz und auch weitgehend in ihrer Dom^nenstruktur den beschriebenen, erfindungsgemSBen Semaphorinen vom 
Typ L, sind jedoch gegebenenfalls gegenuber diesen verkurzt. Beispielsweise k6nnen Splicevarianten, denen die 
Transmembrandomane ganz oder teiiweise fehit, gebildet werden. Ein Semaphorin-Derivat, welches keine oder keine 
vollstandige Transmembrandomane. aber ein Signalpeptid enthait. kann sezerniert werden und auf diese Weise auBer- 
halb der Zelle lokal oder auch uber grOBere Entfernungen wirken, beispielsweise auf andere Zellen. Eine andere Spli- 
cevariante kann beispielsweise keine Sequenz mehr enthalten. die fur ein Signalpeptid kodiert und gegebenfalis auch 
keine Sequenz. die fur eine fur hydrophobe Aminosauresequenz kodiert, die eine potentielle Transmembrandomane 
darstellt. Eine Folge ware, daB dieses Semaphorin-Derivat weder in die Membran eingebaut. noch sezerniert wird (es 
sei denn uber sekretorische Vesikei). Ein solches Semaphorin-Derivat karin an intrazellularen Prozessen, beispiels- 
weise an Signaltransduktionsprozessen beteiligt sein. Auf diese Weise kOnnen mit dem gleichen Grundmolekule (Sem- 
aphorine vom Typ L) und den davon abgeleiteten Derivaten (beispielsweise Splicevarianten) vielfailtige intra- und 
extrazefluiare Prozesse reguliert und/oder aufeinander abgestimnrrt werden. 

Eine besondere Ausfuhrungsform der Erfindung betrifft Semaphorin-Derivate, die sich von den erlindungs- 
gemaBen Semaphorinen vom Typ L aWeiten, die aber keine oder keine votlstandige Transmembrandomane enthalten. 

Eine weitere Ausfuhrungsfam der Erfindung betrifft Semaphorin-Derivate, die sich von den erfindungsgemaBen 
Semaphorinen vom Typ L aWeiten, die aber kein Signalpeptid enthalten. 

Das Signalpeptid kann auch posttranslationai abgespalten werden. Dadurch wird ein membranstandiges (mit TM- 
Domane) oder ein sezerniertes (Splicevariante ohne TM-Domane) Semaphorin-Derivat mit verkurzter Domanenstruk- 
tur gebildet. Ein auf diese Weise posttranslationai prozessiertes Semaphorin-Derivat enthait nur noch Sema-Domane. 
Ig-Domane und gegebenfalis Transmembrandomane. Eine Signalpeptkischnittstelle kann beispielsweise direkt am 
Ende des Signalpeptids liegen, sie kann z.B. 40 bis 50 Aminosauren oder weiter vom Aminoterminus entfernt lokalisiert 
sein. 

Ein "verkurztes" (d.h. weniger Domanen enthattendes) Semaphorin L-Derivat ist von anderen Semaphorinen, die 
sich nicht von den Semaphorinen vom Typ L ableiten, dadurch zu unterscheiden. daB es eine sehr groBe (> 90 %) Ami- 
nosaureidentitat oder eine identische Aminosauresequenz mit den Semaphorinen vom Typ L in den vorhandenen 
Domanen aufweist. 

Die erf indungsgemaBen Semaphorine kCnnen auch in anderer Weise posttranslationai modifiziert sein. Beispiels- 
weise kdnnen sie ein-, zwei-. drei-. vier- funf. sechs-» sieben-. acht-. neun- zehn- oder mehrfach glykosyliert (N- 
und/oder 0-glykosyliert) voriiegen. Die Aminosauresequenzen der Semaphorine kdnnen dann ebenso viele oder mehr 
Konsensussequenzen fur potentielle Glykosylierungsstellen aufweisen. vorzugsweise funf derartige Stellen. Eine Aus- 
fuhrungsform der Erfindung betrifft Semaphorine. bei denen die Glykosylierungsstellen an Positionen lokalisiert sind. 
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die den Positionen 105, 157. 258. 330 und 602 der H-SemaL Aminosauresequenz entsprechen (Tabelle 4). 

Daruber hinaus konnen die Semaphorine in Form ihrer phosphorylierten Derivate vorliegen. Semaphorine konnen 
die Substrate unterschiedlicher Kinasen sern. beispietsweise konnen die AminosSuresequenzen Konsensussequenzen 
fur Protein Kinase C, Tyrosin Kinase und/oder Kreatin Kinasen aufweisen, Weiterhin konnen die Aminosauresequen- 
zen der Semaphorine Konsensussequenzen fur potentielle Myristylierungsstellen aufweisen. An diesen Stelten k6nnen 
entsprechende Semaphorln-Derivate mit Myristinsaure verestert setn. 

Die erfindungsgem^Gen Semaphorine vom Typ L und deren Derivate konnen in Form von Monomeren, Dimeren 
und/oder Multimeren vorliegen. beispielsweise konnen zwei Oder mehr Semaphorine bzw. deren Derivate Qber inter- 
molekulare Disulfidbrucken miteinander verbunden sein. Daruber hinaus kCnnen sich intramolekulare Disuifidbrucken 
ausbilden. 

Derivate der erfindungsgemaBen Semaphorine sind weiterhin Fusionsproteine. Ein solches Fusionsprotein enthait 
einerseits ein Semaphorin vom Typ L Oder Teile desseiben und danjber hinaus ein weiteres Peptid Oder Protein bzw. 
ein Teil desseiben. Peptide oder Proteine bzw. Teiie derseiben konnen z.B. Epitope-Tags (z.B, His-Tag (6xHistidin). 
Myc-Tag. flu-Tag), die z.B. zur Aufreinigung der Fusionsproteine venwendet werden kdnnen. oder solche. die zur Mar- 
kierung der Fusionsproteine venwendet werden konnen. z.B. GFP (green fluorescent protein), sein. Beispiele fur Deri- 
vate der Semaphorine vom Typ L sind z. B. durch die in den Beispielen beschriebenen Konstrukte gegeben. Die 
Sequenzen dieser Konstrukte kOnnen aus den Tabellen 7 bis 15 gegebenenfalls unter Berucksichtigung der Annotatio- 
nen zu den Plasmiden entnommen werden. 

Weiterer Gegenstand der Erfindung sind NukJeinsaure-Sequenzen. vorzugsweise DNA- und RNA-Sequenzen. die 
fur die erfindungsgemaBen Semaphorine vom Typ L und/oder deren Derivate kodieren, beispielsweise die entspre- 
chenden Gene, die unterschiedlichen Splicevarianten der mRNA. die dazu korrespondierenden cDNAs sowie deren 
Derivate, z.B. Saize der DNA bzw. RNA Derivate im Sinne der Erfindungen sind Sequenzen oder Teile davon, die z.B. 
mit molekularbiologischen Methoden verandert und an die jeweiligen Anforderungen angepaBt werden. beispielsweise 
verkurzte Gene oder Teile der Gene (z. B. Promotorsequenzen, Terminatorsequenzen), cDNAs Oder Chim^re dersei- 
ben. Konstrukte fur Expressionen urtd Klonierungen und deren Salze. 

Eine Ausf uhrungsforrn betrifft die genomischen Sequenzen (Gene) der Semaphorine vom Typ L Die Erfindung 
betrifft die Intron- und Exon-Sequenzen und genregulatorische Sequenzen. beispielsweise Promoter-. Enhancer- und 
Silencer-Sequenzen. 

Ein Gegenstand dieser Ausfuhrungsform ist das Gen von H-SemaL bzw. dessen Derivate. Ein Gegenstand der 
Erfindung ist ein Gen, das die Nukleotidsequenz. die in Tabelle 14 gegeben ist. enthait. Ein weiterer Gegenstand der 
Erfindung ist das Gen. das die Nukleotidsequenz. die in der Datenbank GenBank® unter der Zugangsnummer 
AF030697 hinterlegt ist, enth^tt. 

Ein weiterer Gegenstand dieser Ausfuhrungsform ist das Gen von M-SemaL bzw. dessen Derivate. 

Ein weiterer Gegenstand der Erfindung ist die cDN A von H-SemaL oder deren Derivate (z. B. Teile der cDN A). Eine 
besondere Ausfuhrungsform ist die cDNA von H-SemaL gemaB der Nukleotidsequenz in Tabelle 2. Ein weiterer 
Gegenstand der Erfindung ist die cDNA von H-SemaU die in der Datenbank GenBank® unter der Zugangsnummer 
AF030698 hinterlegt ist Gegenstand der Erfindung sind auch die zu diesen cDNAs korrespondierenden mRNAs bzw. 
Teile derseiben. 

Ein weiterer Gegenstand der Erfindung ist die cDN A von M-SemaL oder deren Derivate (z, B. Teile der cDN A). Eine 
besondere Ausfuhrungsform ist die partielle cDNA-Sequenz von M-SemaL gemSB Tabelle 3 sowie cDNA-Sequenzen. 
die diese partielle cDNA-Sequenz enthalten. Eine weitere /\usfuhrungsform der Erfindung betrifft die cDNA von M- 
SemaL, die in der Datenbank GenBank unter der Zugangsnummer AF030699 hinterlegt ist. Gegenstand der Erfindung 
sind auch die zu diesen cDNAs korrespondierenden mRNAs bzw. Teile derseiben. 

Die Erfindung beinhattet auch Allele und/oder individuelle Auspragungsformen der Gene/mRNAs/cDNAs. die sich 
nur geringfugig von den hier beschriebenen Semaphorin-Sequenzen unterscheiden und fur ein identisches oder nur 
geringfugig verandertes Protein (Abweichung in der Aminosaure-Sequenz Weiner oder gleich 10%) kodieren (weiteres 
Beispiel fur Derivate). Weitere Beispiele fur die Derivate sind durch die in den Beispielen angegebenen Konstrukte 
gegeben. Die Sequenzen dieser Konstrukte sind In den Tabellen 7 bis 14 dargestellt und kdnnen unter Berucksichti- 
gung der Annotation fur Plasmide interpretiert werden. 

Ein weiterer Gegenstand der Erfindung sind Plasmide, die DNA. die fur die Semaphorine des Typs L bzw. deren 
Derivate kodiert. enthalten. Solche Plasmide konnen beispielsweise Plasmide mit hohen Replikationsraten sein, die fur 
eine Amplifikation der DNA, z.B. in E. coli geeignet sind. 

Eine spezielle Ausfuhrungsform sind Expressionsplasmide, mit denen die Semaphorine bzw. Teile davon oder 
deren Derivate in prokaryoten und/oder eukaryoten Expressions-Systemen exprimiert werden kOnnen. Es sind sowohl 
Expressionsplasmide die konstitutive als auch solche, die induzierbare Promotoren enthalten. geeignet 

Gegenstand der Erfindung sind auch Verfahren zur Herstetlung von Nukleinsauren^ die fur Semaphorine vom Typ 
L Oder Derivate derseiben kodieren. 

Beispielsweise konnen diese NukleinsSuren. z B. DNA oder RNA auf chemischem Weg synthetisiert werden. Insbeson- 
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dere kdnnen diese Nukleins^uren, z. B. die enlsprechenden Gene Oder cDNAs bzw. Teile derselben mit der PGR unter 
Verwendung von spezifischen Primern und geeignetem Ausgangsmaterial als Template (z. B. cDNA aus einem geeig- 
neten Gewebe Oder genomische DNA) amplifiziert werden. 

Ein konkretes Verfahren zur Herstellung von Semophorin L cDNA bzw. des H SemaL Gens ist in den Beispielen 
beschrieben. 

Die Erfindung betrifft auch Verfahren zur Herstellung der Semaphorine vom Typ L Beispielsweise kann ein Sema- 
phorin L Oder ein Derivat desselben dadurch hergestellt werden, daB eine entsprechende NukleinsSure-Sequenz, die 
fur ein Semaphorin vom Typ L Oder ein Derivat desselben kodiert, in einen Expr essionsveklor kloniert und mit diesem 
rekombinanten Vektor eine geeignete Zelle transformiert wird. Es kCnnen beispielsweise prokaryote Oder eukaryote 
Zellen venwendet werden. Die Semaphorine vom Typ L oder deren Derivate kbnnen gegebenenfalls auch auf chemi- 
schem Weg hergestellt werden. 

Daruber hinaus konnen die Semaphorine vom Typ L bzw. deren Derivate als Fusionsproteine exprimiert werden, 
beispielsweise mit Proteinen oder Peptiden, die einen Nachweis des exprimierten Fusionsproteins eriauben, z.B. als 
Fusionsprotein mit GFP (green fluorescent protein). Die Semaphorine kdnnen auch als Fusionsproteine mit einem. 
zwel, drei oder mehreren Epitop-Tags. beispielsweise mit ivlyc- und/oder His-(6xHistidin) und/oder flu-Tags exprimiert 
werden. Entsprechend kdnnen Plasmide venwendet Oder hergestellt werden, die DNA-Sequenzen enthatten, die fur 
diese Fusionsproteine kodieren. Beispielsweise kdnnen Semaphorin kodierende Sequenzen in Plasmide kloniert wer- 
den, die DNA-Sequenzen enthalten, die fur GFP und/oder Epitop-Tags, z.B. Myc-Tag. His-Tag, flu-Tag kodieren. Kon- 
krete Beispiele dafur sind durch die Beispiele und die in den Tabellen aufgefiihrten Sequenzen ggfs. unter 
Zuhilfenahme der Annotation zu den Plasmiden gegeben. 

Ein weiierer Gegenstand der Erf indung-sind Antikorper, die spezif isch die Semaphorine vom Typ L, deren Derivate 
Oder Teile davon binden bzw. erkennen. Dies kdnnen beispielsweise polyklonale Oder monoklonale AntikOrper, cfie z.B. 
in Maus, Kaninchen, Ziege, Schaf. Huhn usw. hergestellt werden kOnnen, sein. 

Eine besondere Ausfuhrungsforrn dieses Gegenstandes der Erfindung sind AntikCrper, die gegen die Epitope die 
den Aminos^uresequenzen von Position 179 bis 378 bzw. 480 bis 666 der H-SemaL Sequenz gem§f3 Tabelle 4 ent- 
sprechen. gerichtet sind. Die Erfindung betrifft auch ein Verfahren zur Herstellung von spezifischen Anti-Semaphorin L 
Antikdrpern, wobei fur die Herstellung Antigene venwendet werden, die genannten Epitope enthalten. 

Die Erfindung betrifft auch Verfahren zur Herstellung der Antikorper, vorzugsweise wird dazu ein Fusionsprotein. 
bestehend aus einem charakteristischen Semaphorin Epitop und einem Epilop-Tag. welches fur die anschliefJende 
Aufreinigung des rekombinanten Fusionsproteins venwendet werden kann. Das aufgereinigte Fusionsprotein kann 
anschlieBend fur die Immunisierung venwendet werden. Zur Herstellung des rekombinanten Fusionsproteins wird ein 
entsprechender rekombinanter Expressionsvektor hergestellt und mit diesem eine geeignete Zelle transformiert. Aus 
dieser Zelle kann das rekombinante Fusionsprotein isoliert werden. Die Durchfuhrung kann beispielsweise wie in Bei- 
spiel 8 beschrieben erfolgen. 

Diese AntikGrper k6nnen beispielsweise zur Aufreinigung der entsprechenden Semaphorine, z.B. von H-SemaL 
und dessen Derivaten z.B. uber AffinitatssSulen oder zum immunologischen Nachweis der Proleine, z.B. im ELISA, im 
Western-Blot und/oder in der Immunhistochemie venwendet werden. Die /Vntikdrper kdnnen auch zur Analyse der 
Expression von H-SemaU z. B. in verschiedenen Zelltypen bzw. Zellinien verwendet werden. 

Die cDNA von H-SemaL hat eine L3nge von 2636 NuWeotiden (Tabelle 2). Das Genprodukt der H-SemaL-cDNA 
hat eine Unge von etwa 666 Afninos§uren (Tabelle 4) und weist die typische Domanenstruktur eines Semaphorins 
vom Typ L auf. Das Genprodukt weist ein N-terminales Signalpeptid (AminosSuren 1 bis 44). Senna-Domane (Amino- 
s^ure 45 bis ungefahr AminosSure 545) und Ig (Immunglobulin)-Domdne (etwa Aminosauren 550 bis 620) sowie am C- 
terminalen Ende eine hydrophobe Aminosduresequenz auf, die eine potentielle TransmembrandomSne darstellt. Diese 
Domanen-Struktur wurde bisher fur Semaphorine noch nie beschrieben. Es handelt sich um ein membranassoziiertes. 
wahrscheinlich an der Zelloberf ISche lokalisiertes Glykoprotein einer neuen Untergruppe. Aufgrund dieser bisher nicht 
bekannten Domanenstruktur kCnnen die Semaphorine nun in VI Untergruppen eingeteilt werden: 

I Sezerniert, ohne weitere Domane (z.B. 0RF-A49) 

M Ig Sezerniert (ohne Transmembrandomane) (z.B. AHV-Sema) 

III Ig, TM, CP Membranverankert mit zytoplasmatischer Sequenz (z.B. CD100) 

IV Ig, (P). HPCSezerniert mit hydrophilem C-Terminus (z.B. H-Sema III, M-SemaD, Collapsin-1) 

V Ig, TM. CP Membranverankert mit C-terminalem 7 Thrombospondin-Motiv (z.B. M-Sema-F und G) 

VI Ig, TM Membranverankert (z.B. H-SemaL. M-SemaL) 

Die nichtglykosylierte, nichtprozessierte Form von H-SemaL hat ein errechnetes Molekulargwicht von etwa 74,8 kO 
(74823 Dalton) (berechnet mit PeptideSort, GCG-Programm-Paket). Der Isoelektrische Punkt berechnet sich zu pH= 

7.56. 

Eine mdgliche Signalpeptid-Schnittstelle liegt zwischen den Aminosauren 44 und 45 (Tabelle 3; berechnet mit SignalP 
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(httpV/www.cbs.dtu.dk/services/Signal P). einem auf neuronalen Netzwerken basierenden Programm zur Analyse von 
Signalsequenzen {Nielsen H. et al. (1997) Protein Engineering 10:1-6}). Dies ergibt fur das prozessierte Protein (ohne 
Signalpeptid) ein Molekulargewicht (MW) von 70.3 kD (70323 Oalton) und einen Isoelektrischen Punkt von pH=7.01. 

Die genomlsche Struktur ist ebenfalls weitgehend geWart. Das H-SemaL-Gen weist 13 Oder 15 Oder mehr Exons. 
vorzugsweise 14 Exons und 12 Oder 14 Introns. vorzugsweise 13 Introns auf. Aufgrund dieser komplexen Exon-lntron- 
Struktur sind unterschiedliche Splice- Varianten mogfich. Die mRNA des transkribierten H-SemaL-Gens findet sich im 
Northern-Blot vor allem in Placenta, Keimdrusen, Thymus und Milz. Es wurde keine mRNA in neuronalem Gewebe 
Oder in Muskelgewebe nachgewiesen. Ein Hinweis auf eine spezifisch regulierte Expression in Endothelzellen liegt vor 

Durch alternatives Splicing konnen auch Formen von H-SemaL mit intrazytoplasmatischen Sequenzen entstehen, 
die eine Rolle in der intrazelluiaren Signaltransduktion spielen, ahnlich wie z.B. bei CD100. 

Ebenfalls m6glich waren durch alternatives Splicing entstehende. sezernierte Formen von H-SemaL analog zum vira- 
ten AHV-Sema. 

Nukleotid- und Aminosauresequenzanalysen wurden mit Hilfe des GCG Programm-Pakets (Genetics Computer Group 
(1991) Program manual for the GCG package, version 7. 575 Science Drive. Wisconsin. USA 5371 1), FASTA (Pearson 
und Lipman (1988) Proc. Natl. Acad. Sci. 85. 2444-2448) und BLAST- Program (Gish und States (1993) Nat. Genet.3. 
266-272: Altschul et al. (1990) J. Mol. Biol. 215. 403-410) durchgefuhrt. Diese Programme wurden auch for Sequenz- 
vergleiche mit GenBank (Version 102.0) und Swiss Prof (Version 34.0) venwendet. 

Posttranslationale Modifikationen wie Glykosylierung und Myristylierung von H-SemaL sind ebenfalls mCglich. 
Konsensus-Sequenzen fur N-Glykosylierungsstellen wurden mit Hilfe des Programms Prosite (GCG Programm- Paket) 
an den Positionen 105. 157, 258. 330, 602 der Aminos5uresequenz von H-SemaL (gemaB Tabelle 4) gefunden, solche 
fur Myristylierung an den Positionen 114. 139. 271 . 498. 499. 502. 654 (Konsensus-Sequenz: G-(E. D. R, K, K P F Y 
W) X (S. T, A.G, C. N)~-(P)). Daruber hinaus enthalt die Aminosauresequenz von H-SemaL mehrere Konsensus- 
Sequenzen fur potenttelle Phosphorylierungsstetlen durch unterschiedliche Kinasen. Deshalb kann davon ausgegan- 
gen werden, daf3 H-SemaL das Substrat unterschiedlicher Kinasen sein kann. z.B. Phosphorylierungssteilen fur Krea- 
tin-Kinase 2, Protein-Kinase C und Tyrosin-Kinase. 

Vorausgesagte Kreatin-Kinase 2-Phosphorylierungs-Stellen (Konsensussequenz Ck2: (S.T)x2(D,E)) (Prosite. 
GCG) an den Positionen 119. 131. 173. 338. 419. 481 der Aminos^uresequenz. Vorausgesagte Protein-Kinase-C- 
Phosphorylierungs-Stellen (Konsensussequenz PkC: (S.T)x(R.K)) (Prosite, GCG) an den Positionen 107, 115, 190. 
296, 350. 431. 524. 576 der Aminosauresequenz. Vorausgesagte Tyrosin-Kinase-Phosphoryfierungs-Steile (Konsen- 
sussequenz: (R.K)x{2.3}(D.E)x{2.3}Y) (Prosite GCG) an Position 205 der Aminosauresequenz. 
Die Konsensussequenzen sind im Einbuchstabencode fur Aminosauren angegeben. 

Ein fur Integrine charakteristisches "RGD"-Motiv (Arginin-Glycin-Asparaginsaure) findet sich an Position 267. 
Die Glykosylierungsstellen sind gut konserviert zwischen viralem AHV-Sema. H-SemaL und (soweit bekannt) M- 
SemaL. 

Eine Di- oder Multimerisierung von H-SemaL ist moglich und wurde bei anderen Semaphorinen wie CD100 
beschrieben {Hall et al. (1996)}. Das CD100 Molekul ist ebenfalls ein membranverankertes Glykoprotein-Dimer von 
150kd. CD100 ist jedoch nicht nahe venwandt mitdem erfindungsgemSBen humanen Semaphorin (H-SemaL). 

Die partielle cDNA-Sequenz von M-SemaL hat eine L^nge von 1 195 Nukleotiden. Diese Sequenz kodiert fur ein 
Protein mit 394 Aminosduren. Diese 394 Aminosduren entsprechen den Aminosauren 1 bis 396 von H-SemaL. Das 
Signalpeptid im M-SemaL ersteckt sich uber die Aminosauren 1 bis 44 (genau wie im H-SemaL). Die Sema-DomSne 
beginnt bei der AminosSure 45 und erstreckt sich bis zum Ende bzw. wahrscheinlich uber das Ende der Sequenz 
gem^B Tabelle 4 hinaus. 

Multiple Alignments wurden mit Hilfe des Programms Clustal W (Thompson et al. (1994)) durchgefuhrt Diese Ali- 
gnments wurden manuell weiterbearbeitet mit Hilfe von SEAVIEW (Galtier et al. (1996) Comput Appl. Biosci 12. 543- 
548). Die phylogenetischen Entfernungen wurden mit Clustal W (Thompson et al. (1994)) bestimmt. 

Ein Vergleich der Proteinsequenzen der bekannten und der neuen Semaphorine und eine phylogenetische Ana- 
lyse dieser Sequenzen zeigt. daB sich die Gene entsprechend ihrer phylogenetischen Venwandschalt einteilen lassen. 
Hier flieBt naturlich die C-terminale DomSnenstruktur der entsprechenden Semaphorin-Subtypen als entscheidender 
Faktor mit ein, weshalb Semaphorine der gleichen Untergruppen in der Regel auch phylogenetisch naher verwandt 
sind. als Semaphorine unterschiedlicher Untergruppen. EinfluB hat auch, aus welcher Speziesdas Semaphorin isoliert 
wurde, d.h, ob die entsprechenden Spezies phylogenetisch nahe miteinander verwandt sind oder nicht. 

Eine phylogenetische Analyse (vergl. Figur 3) der bekannten Semaphorin Aminosauresequenzen (vollstandige 
Sequenzen und/oder Teilsequenzen, wobei die Aminosauresequenzen fur H-SemaL und M-SemaL gemSB den Tabel- 
len 4 und 5 venwendet wurden. fur aile anderen Sequenzen. die unter den Zugangsnummern gespeicherten Sequen- 
zen bzw. die von diesen Sequenzen abgeleiteten Aminosauresequenzen)) mittets des Programms CLUSTALW 
{Thompson J.D. et al. (1994) Nucleic Acids Res. 22:4673-4680} zeigt, daB die Aminosauresequenzen von H-SemaL 
und M-SemaL phylogenetisch nahe miteinander ven«andt sind und eine eigene phylogenetische Gruppe bilden. H- 
SemaL und M-SemaL wiederum sind phylogenetisch am ndchsten verwandt mit AHV-Sema und Vac-A39. Sie sind 
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untereinander deutlich nSher verwandt. als mit irgendeinem anderen bisher bekannten Semaphorin. Die Analyse zeigt 
weiterhin, da3 auch andere Semaphorine phylogenetisch nahe miteinander verwandt sind und eigene Gruppen inner- 
halb der Semaphorine bllden. Beispielsweise fallen die Semaphorine, die sezerniert werden, z.B. H-Sema III, IV. V, und 
E in eine phylogenetische Gruppe. Zu dieser Subfamiiie gehoren auch deren Homologe in anderen Spezies. wahrertd 
das humane (transmembrane) CD 100 mit dem entsprechenden Maus-Homologen (M-Sema G2) und mit Collapsln-4 
in eine phylogenetische Gruppe faiK. 

Im Bezug auf die gesamten Aminos^uresequenzen liegen die beobachteten Homologien innerhalb der phylogene- 
tischen Gruppen zwischen etwa 90% und 80% AminosSureidentitat im Bezug auf sehr nahe verwandte Gene wie z.B. 
H- und M-SemaE Oder -lll/D urxJ etwas weniger als 40% bei wenig verwandten Genen der Semaphorine. Innerhalb der 
Sema-Domane liegt die beobachtete AminosSureidentitat urn einige Prozent hoher, und durch ihren groBen Anteil am 
Gesamtprotein (50-80% des Proteins gehoren zur Sema-Dom^ne) der AminosSuresequenz beinfluBt diese wesentlich 
die Gesamtidentitat. 

H-SemaL ist iiber das Gesamtprotein berechnet, zu 46% Identisch mit AHV-Sema, wird dagegen die Sema-DomSne 
allein betrachtet, dann betrSgt die AminosSureidentitat 53%. Dies ist hoher als z.B. zwischen den verwandten M- 
SemaB und -C (37% Identitat im Bezug auf das Gesamtprotein, 43% Identitat im Bezug auf die Sema-Domane), ahn- 
lich wie M-SemaA und -E (43% Gesamtprotein, 53% Sema-DomSne). Die Aminosaureidentitat zwischen der partiellen 
M-SemaL Sequenz (Tabetle 6) und H-SemaL (Tabelle 5) liegt im Bereich der Sema-Domane bei 93%. so da3 davon 
ausgegangen werden kann. daB es sich urn das entsprechend homologe Gen der Maus handelt. 
Korrespondierende Semaphorine zu H-SemaL und M-SemaL in anderen Spezies kOnnen innerhalb der Sema-Domane 
eine Aminosaureidentitat grOBer als 40% im Bezug auf H-SemaL aufweisen. Bei den nahe venwandten Wirbeltieren 
(Sauger. Voge!) konnen sogar Aminosaureidentitaten uber 70% angetroffen werden. 

Es handeftsich um eine neue Subfamiiie von Semaphorinen mit grOBerer Aminosaureidentitat zu dem viralen AHV- 
Sema als zuden bisher bekannten humanen bzw. murinen Semaphorinen, und mit einer fur humane Semaphorine bis- 
her nicht bekannten C-terminalen Struktur. Diese neuen Semaphorine (Mitglieder der Subfamiiie) zelchnen sich 
dadurch aus, daB sie aufgrund ihrer Domanen-struktur in die Untergruppe IV fallen und/oder die gleiche phylogeneti- 
sche Gruppe fallen wie H-SemaL und M-SemaL und/oder im Bezug auf die gesamte Aminosauresequenz zu H-SemaL 
eine Aminosaureidentitat von mindestens 30 bis 40 %. vorzugsweise 50 bis 60 %. besonders bevorzugt 70 bis 80 % 
Oder eine grOfiere Identitat aufweisen und/oder im Bezug auf die Sema-Domane eine Aminosaureidentitat mit H- 
SemaL von mindestens 70 %, vorzugsweise groBer 80 %. besonders bevorzugt grdBer 90 % aufweisen. 

Den Semaphorinen vom Typ L kommt auch eine andersartige biochemische Funktion zu. Eine neue Funktion die- 
ser Semaphorine liegt in der Modulation des Immunsystems. 

Das nachste Venwandte von H-SemaL ist das virale AHV-Semaphorin (AHV-Sema). Dieses ist von ahnlicher 
GrOBe, besitzt aber im Gegensatz zum H-SemaL keine Transmembrandomane. Das AHV-Sema wird vermutiich von 
virusinf izierten Zellen sezerniert. um den H-SemaL aquivalenten Rezeptor (Semaphorin von Typ L im Streifengnu) im 
naturlichen Wirt (Streifengnu) zu blockieren, und so dem Angriff des Immunsystems zu entgehen. Ferner ist eine Funk- 
tion als repulsives Agens (Chemorepellent) fur Zellen des Immunsystems denkbar. 

Die biochemische Funktion der neuen Semaphorine vom Typ L und deren Derivate ist als genereil immunnxxJulie- 
rend und/oder entzundungsrrKxJulierend anzusehen. Einerseits kOnnen sie 

A) als die Immunantwort hemmende Molekule entweder lokal, z.B. als Transmembranprotein an der Oberfiache 
von Zellen oder auch uber grOBere Entfernungen, z.B. wenn sie durch Prozessierung (z.B. Proteasen) oder alter- 
natives Splicing sezerniert werden, z.B. durch Diffusion im Gewebe, ihre Wirkung als Chemorepellent und/oder 
Immunsuppressivum entfalten. 

Beispielsweise kann die Expression dieser neuen Semaphorine vom Typ L z.B. an der Oberfiache der Zellen der 
GefaBendothelien das Leukozyten-Attachment und deren Migration durch die GefaBwand verhindern. Den neuen 
Semaphorinen kann eine Rolle bei der Aufrechterhaltung von Schrankenwirkungen, z.B. zur Verhindung von Infek- 
tionen in besonders "wichtigen" oder exponierten Organen, beispielsweise zur Aufrechterhaltung der Blut-Hirn- 
Schranke. des Plazentarkreislaufs und/oder anderen immunologisch priviligierten Orten (z.B; Pancreas-lnsein) 
und/oder beim Schutz vor Autoimmunerkrankungen zukommen. Daruber hinaus kdnnen die neuen Semaphorine 
und/oder ihre Derivate in verschiedenen Geweben auch an repulsiven Signalen, beispielsweise fur Zellen des 
Immunsystems (z.B. Leukozyten) als Schutz gegen versehentliche Aktivierung von Abwehrmechanismen beteiligt 
sein. 

B) Weiterhin kOnnen den neuen Semaphorinen und/oder deren Derivaten Funktionen als akzessorische Molekule 
zukommen. An der Zelloberf lache exprimiert kOnnen sie beispielsweise an der Interaktion mit Zellen des Immun- 
systems im Rahmen der Aktivierung von Abwehrmechanismen z. B, bei Virusinfektionen beteiligt sein. 

Dadurch ergeben sich mehrere Venwendungsmdglichkeiten fur die neuen Sempahorine vom Typ L und deren Deri- 
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vaten sowie den fur diese Proteine kodierenden Nukleins^uren. 

Funktion A): Es handett sich um ein rmmunsuppressives und/oder entzundungshemmendes Prinzip: Zahlreiche 
potentielle Anwendungsmoglichkeilen liegen in den Bereichen Organtransplantation. Entzundungstherapie. Immunthe- 
rapie und Gentherapie. 

Beispielsweise kdnnen mit Hilfe der Semaphorin-kodierenden DNA cxler Derivaten derselben nichthumane. trans- 
gene Tiere hergestellt werden. 

Eine Anwendungsmdglichkeit dieser Tiere liegt in der Hemmung der TransplantatabstoBung in transgenen Modellen fur 
Organtransplantationen. Beispielsweise konnen transgene. gegen AbstoBung geschutzte tierische Organe fur Xeno- 
transptantationen hergestellt werden. Dies sollte z.B. auch zusammen mitanderen Transgenen (z.B. Komplementregu- 
tatoren wie DAF Oder CD59) mdglich sein. 

Eine weitere Anwendung liegt in der Herstellung von nicht-humanen Knock-out Tieren, beispielsweise von Knock-out 
Mausen(„Laboratory Protocols for Gene-Targeting". Torres and Kuhn (1997) Oxford University Press, ISBN 0-19- 
963677- X): Durch Knock-out des Mausgens M-SemaL konnen z.B. weitere Funktionen des Gens aufgefunden werden. 
Sie stellen auch potentielle Modellsysteme fur entzundliche Erkrankungen dar. falls die Mause ohne Semaphorin-Gen 
lebensfahig sind. Sollte M-SemaL fur die Immunmodulation wichtig sein, so sind vermehrt solche Mause zu erwarten. 
Weiterhin kdnnen nicht-humane Knock-in- Tiere, beispielsweise Mause, hergestellt werden. Dabei wird z.B. M-SemaL 
durch normal es/verandertes H-SemaL oder verandertes M-SemaL (z.B. integration der neuen Semaphorin-Subtypen 
unter der Kontrolle von konstitutiven und/oder induzierbaren Promoter en) ersetzt. Solche Tiere konnen z.B. fur die 
Suche nach weiteren Funktionen der neuen Semaphorine, z.B. Funktionen des humanen Gens oder Derivaten dieser 
Gene dienen oder zur Identifizierung und Charakterisierung von immunmodullerenden Wirkstoffen benutzt werden. 

Venwendung von z. B. Nukleins^uren, die fur Semaphorine vom Typ L oder Derivate derselben kodieren, zur Her- 
stellung von z.B. rekombinanten Immunsuppressiven, anderen loslichen Proteinen oder Peptiden die sich von der Ami- 
nosauresequenz der Semaphorine vom Typ L. z.B. Von H-SemaL oder den entsprechenden Nukleinsauren, z.B. 
Genen ableiten. In ahnlicher Weise konnen auch Agonisten mit struktureller Ahnlichkeit hergestellt werden. Diese 
immunsuppressiven Wirkstoffe/Agonisten konnen bei Autoimmunerkrankungen und entzundlichen Erkrankungen 
und/oder Organtransplantation en eingesetzt werden. 

Gentherapie mit Semaphorinen vom Typ L, z.B. mit Nukleinsauren, die fur H-SemaL oder deren Derivate kodieren, 
z. B. mittels viraler oder nichtviraler Methoden. Einsatz bei Autoimmunerkrankungen und entzundlichen Erkrankungen. 
der Transduktion von Organen sowie vor/wahrend/nach Transplantationen zur Verhinderung der Transplantatabsto- 
Bung. 

Insbesondere konnen die neuen Semaphorine und/oder die fur diese Semaphorine kodierenden Nukleinsauren 
und Derivate derselben, insbesondere H-SemaL, fur H-SemaL kodierende DNA und Derivate derselben in einem Ver- 
fahren zum Screening von Wirkstoffen. insbesondere zur Identifizierung und Charakterisierung von immunnodulieren- 
den Wirkstoffen, eingesetzt werden. 

Funktion B): H-SemaL ist ein akzessorisches Molekul. das an der Zelloberf lache exprimiert wird und an der Inter- 
aktion mit Zellen, z.B. des Immunsystems. z.B. als akzessorisches Molekul in der Aktivierung von Signalwegen, betei- 
tigt ist Ein virales Gen bzw. das Genprodukt eines viralen oder anderen pathogenen Gens z.B. mikrobilogischen 
Ursprunges konnte z.B. als kompetltiver Inhibitor dieses akzessorischen Molekuls wirken. Eine Anwendung fur die 
neuen Semaphorine liegt bei dieser Funktion ebenfalls im Bereichder Organtransplantation, Entzundungstherapie. Irn- 
muntherapie und/oder Gentherapie. 

Beispielsweise konnen die neuen Semaphorine in einem Verfahren zum Screening von antagonistischen Wirkstoffen 
bzw. Inhibitoren venwendet werden. Auf diese Welse identifizierte Wirkstoffe kCnnen dann z.B. zur Blockade des Sem- 
aphorin-Rezeptors eingesetzt werden. Ldsliche und/oder sezernierte H-SemaL Antagonlsten bzw. Inhibitoren kfinnen 
beispielsweise chemische Substanzen oder die neuen Semaphorine bzw. Derivate derselben selbst sein (z.B. 
Teile/verkurzte Formen derselben. beispielsweise ohne MembrandomSne oder als Ig-Fusionsproteine oder von diesen 
abgeleitete Peptide, die geeignet sind. den korrespondierenden Rezeptor zu blockieren). Auf diese Weise identifizierte, 
spezifische Antagonisten und/oder Inhibitoren konnen beispielsweise kompetitiv wirken urd bei der Hemmung der 
AbstoBung z.B. in transgenen -Modellen fur Organtransplantationen und bei /Autoimmunerkrankungen, entzundlichen 
Erkrankungen und Organtransplantationen eingesetzt werden. Nukleinsauren, z. B. DNA, die fur die neuen Semapho- 
rine kodieren bzw. deren mit Hilfe von molekularbiologischen Methoden erzeugte Derivate kdnnen beispielsweise fur 
die Herstellung nichthumaner, transgener Tiere verwendet werden. Eine Uberexpression von H-SemaL kann in diesen 
transgenen Tieren zu vermehrter Anfailigkeit fur Autoimmunerkrankungen und/oder entzurxllichen Erkrankungen fuh- 
ren. Solche transgenen Tiere eignen sich damit zum Screening von neuen, spezifischen, immunmodullerenden Wirk- 
stoffen. 

Solche Nukleinsauren kOnnen ebensofur die Herstellung von nicht-humanen Knock-out Tieren, beispielsweise Knock- 
out Mausen, bei denen das Mausgen M-SemaL ausgeschaltet wird, verwendet werden. Solche Knock-out Tiere kdn- 
nen fur die Suche nach weiteren biochemischen Funktionen des Gens eingesetzt werden. Sie stellen auch potentielle 
Modellsysteme fur entzundliche Erkrankungen dar, falls die Mause ohne das M-SemaL Gen lebensfahig sind. 
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Diese DNA kann ebenso zur Herstellung von nicht-humanen Knock-in Tieren. beispielsweise M§usen verwendet wer- 
den. Dabei wird das M-SemaL-Gen durch ein verSndertes M-SemaL Gen/cDNA Oder ein gegebenfalls verSndertes, 
z.B. mutiertes Semaphorin Typ L Gen/cDNA einer anderen Spezies, z.B. von H-SennaL ersetzt, Solche transgenen 
Tiere konnen fur die Suche nach weiteren Funktionen der erfindungsgemSBen Semaphorine venwendet werden. 

Die Erfindung betrifft auch die Verwendung der Sennaphorine vom Typ L und deren Derivate, sowie der fur diese 
Proteine kodierenden NukleinsSuren. z. B. Gene/cDNAs und deren Derivate und/oder mit Hilfe dieser Semaphorine 
identifizierter Wirkstoffe zur Herstellung von Arzneimitteln. Beispielsweise konnen Arzneimittel hergestellt werden, die 
in der Gentherapie angewendet werden konnen und die Agonisten und/oder Antagonisten der Expression der Sema- 
phorine vom Typ L, beispielsweise von H-SemaL, enthalten. Dazu k6nnen z. B. virale und/oder nichtvlrale Methoden 
verwendet werden. Diese Arzneimittel konnen z.B. bei Autolmmunerkrankungen und entzundliche Erkrankungen, 
Orgarrtransplantationen vor und/oder wahrend und/oder nach der Transplantation zur Verhlnderung der AbstoBung ein- 
gesetzt werden. 

Die fur die neuen Semaphorine kodierenden NukleinsSuren, z. B. Gene, cDNAs und deren Derivate kdnnen auch als 
Hilfsmittel in der Molekularbiologie eingesetzt werden. 

Daruberhinaus konnen die neuen Semaphorine, insbesondere H-SemaL und NuWeins^uren, z. B. Gene/cDNAs der- 
selben in Verfahren zum Screening neuer Wirkstoffe eingesetzt werden. Modrfizlerte Proteine und/oder Peptide, die 
sich z. B. von H-SemaL und/oder M-SemaL ableiten, kcJnnen zur Suche nach dem entsprechenden Rezeptor und/oder 
dessen Antagonisten bzw. Agonist in funktionellen Tests, beispielsweise mittels Expressionskonstrukten von H-SemaL 
und Homologen eingesetzt werden. 

Die Erfindung betrifft auch die Venwendung eines Semaphorins vom Typ L Oder einer NukleinsSure-Sequenz. die 
fur ein Semaphorin vom Typ L kodiert in einem Verfahren zur Identifizierung von pharmakologischen Wirkstoffen. ins- 
besondere von immunmodulierenden Wirkstoffen. 

Die Eriindung betrifft auch Verfahren zur Identifizierung von Wirkstofen, wobei ein Semaphorin vomTyp L Oder ein 
Derivat derselben bzw. eine NukleinsSure-Sequenz, die fur ein Semaphorin vom Typ L kodiert Oder ein Derivat dersel- 
ben eingesetzt wird. urn pharmakologische Wirkstoffe, z. B. immunmodullerende Wirkstoffe zu identifizieren. Beispiels- 
weise betrifft die Erfindung ein Verfahren, bei dem ein Semaphorin vom Typ L unter def inierten Bedingungen mit einem 
zu untersuchenden Wirkstoff inkubiert wird und parallel ein zweiter Ansatz ohneden zu untersuchenden Wirkstoff, aber 
unter ansonsten gleichen Bedingungen durchgefuhrt wird und dann die inhibierende bzw. aktivierende Wirkung des zu 
untersuchenden Wirkstoffs bestimmt wird. 

Beispielsweise betrifft die Erfindung auch Verfahren zur Identifizierung von Wirkstoffen, wobei eine NuWeinsSure- 
Sequenz, die fur ein Semaphorin vom Typ L kodiert Oder ein Derivat derselben unter definierten Bedingungen in 
Gegenwart eines zu untersuchenden Wirkstoffs exprimiert wird und das /VusmaB der Expression bestimmt wird. Gege- 
benenfalls konnen auch in einem sdchen Verfahren zwei Oder mehrere Ans^tze parallel unter gleichen Bedingungen 
durchgefuhrt werden, wobei die Ansatze aber unterschiedliche Mengen des zu untersuchenden Wirkstoffs enthalten. 
Beispielsweise kann der zu untersuchende Wirkstoff die Transkription und/oder die Translation inhibieren oder aktivie- 
ren. 

Das Semaphorin vom Typ L kann wie seine viralen Homologen an das neu beschriebene Rezeptormolekul VESPR 
(Comeau et al, (1998) Immunity, Vol. 8, 473-482) binden und kann vermutlich in Monozyten eine Induktion von Zell- 
AdhSsionsmolekulen wie ICAM-1 und Zytokinen wie lnterleukin-6 und lnterleukin-8 bewirken. Dies kann zu deren /Vkti- 
vierung und zur Zellaggregation fuhren. Das Expressionsmuster des VESPR- Rezeptors zeigt teilweise interessante 
Parallein zu H-Senal, z.B, eine starke Expression in Placenta und eine deutliche Expression in Milzgewebe. Interaktio- 
nen mit weiteren, noch unbekannten Rezeptoren der Plexin-Familie. oder anderen Rezeptoren sind mOglich. Auch eine 
Interaktion mit sich selbstoder anderen semaphorindhnlichen Molekulen ist nDdglich. Eine Interaktionder Semaphorine 
vom Typ L kann insbesondere Ober eine konservierte Domdne im C-terminalen Bereichder Sema-DomSne stattfinden. 

Zu den Annotation Plasmiden: 

pMelBacA-H-SemaL (6622bp) in pMelBacA (Invitrogen, De Schelp. NL){SEQ ID NO. 42). Nukleotid 96-98 ATG - 
Startkodon, Nukleotid 96-168 Mellitin Signal-Sequenz, Nukleotid 168-173 BamHI Schnittstelle (PCR/Klonierung), 
Nukleotid 

171-1998 Leserahmen SemaL Aminosduren 42-649 (ohne eigene Signal-Sequenz und ohne Transmennbranse- 
quenz), Nukleotid 1993-1998 EcoRI Schnittstelle (PCR/Klonierung) und Nukleotkj 1992-1994 Stop Codon 

Plasmid pCDNAS.I -H-SemaL-MychisA (7475 bp) (SEQ ID NO. 35): 
Nukleotid 954-959 BamHI Schnittstelle (Klonierung), 

Nukleotid 968-970 ATG SemaL. NuWeotid 968-2965 Leserahmen SemaL. Nukleotid 2963-2968 Pml 1 Schnittstelle. 
Nukleotid 2969-2974 Hindlll Schnittstelle. 

Nukleotid 2981 -301 3 Myc-Tag. Nukleotkj 3026-3033 6xHis-Tag. Nukleotid 3034-3036 Stop Codon. 
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Plasmid pCDNA3.1-H-SemaL-EGFP-MychisA (8192 bp): (SEQ ID NO. 36): 

Nukleotid 954-959 BamHI Schnittstelle (Klonierung). NukJeotid 968-970 ATG SemaL. NukJeotid 968-2965 Leserah- 
men SemaL. Nukleotid 2963-2965 halbe Pml I Schnittstelle. Nukleotid 2966-3682 Leserahmen EGFP (in Pml I Klo- 
niert). Nukleotid 3683-3685 halbe Pml I Schnittstelle. Nukleotid 3685-3691 Hindlll. Nukleotid 3698-3730 Myc-Tag 
Nukleotid 3743-3760 6xHis-Tag. und Nukleotid 3761 -3763 Stop Codon 

Plasmid pIND-H-SemaL-EA (7108 bp) in Vektor pIND (Invitrogen. De Schelp. NL) (SEQ ID No 38): 
Nukleotid 533-538 BamHI Schnittstelle (Klonierung). Nukleotid 546-548 ATG SemaL, Nukleotid 546- Leserahmen 
SEMAL. Nukleotid 2542-2547 Pml I Schnittstelle. Nukleotid 2546-2553 Hindlll Schnittstelle und Nukleotid 2563- 
2565 Stop Codon. 

Plasmid pIND-H-SemaL-EE (Gesamtlange 7102 bp) in Vektor pIND (Invitrogen, De Schelp. NL) (SEQ ID No. 37): 
Nukleotid 533-538 BamHI Schnittstelle (Klonierung). Nukleotid 546-548 ATG SemaL, Nukleotid 546-Leserahmen 
SemaL. Nukleotid 2542-2547 Pml I Schnittstelle. Nukleotid 2548-2553 Hindlll Schnittstelle. Nukleotid 2560-2592 
Myc-Tag, Nukleotid 2605-2622 6xHis-Tag und Nukleotid 2623-2625 Stop Codon. 

Plasmid pQE30-H-SemaL-179-378.seq (4019 bp) in Vektor pQE30 (Oiagen, Hilden) entspricht pQE30-H- 
SemaLBH (SEQ ID No. 39): 

Nukleotid 115-117 ATG. Nukleotid 127-144 6xHis-Tag. Nukleotid 145-750 BamHl-Hlndlll PCR-Fragment SemaL 
Aminosauren (aa) 179-378 und Nukleotid 758-760 Stop Codon. 

Plasmid pQE31-H-SemaL- (SH (3393 bp) in Vektor pQE31 (Qiagen. Hilden) (SEQ ID No. 40): 

Nukleotid 115-117 ATG. Nukleotid 127-144 6xHis-Tag. Nukleotid 147-152 BamHI. Nukleotid 159-729 Sacl-Hindlll 

Fragment SemaL (C-terminal) aa480-666 und Nukleotid 734-736 Stop Codon. 



Beispiele: 



Versuchsbedingungen, die in den Beispielen Anwendung finden: 



Verwendete PCR-Programme: 



Taq52-60 (mit Ampll-Taq^- Polymerase. Perkin Elmer. Weil der Stadt. Deutschland) 



96"C/60s 

96'C/1 5s-52*C/20s-70'*C/60s 
70*'C/60s 



1 Zyklus 
40 Zyklen 
1 Zyklus 



Taq60-30 



96**C/60s . . . 

96*'C/1 5s-60^C/20s-70*'C/30s 
70'C/60s .: - 



1 Zyklus 
35 ZyWen 
1 Zyklus 



Taq60-60 - - - 



96'»C/60s 

96'C/1 5s-60'Cy20s-70*C/60s 
70"C/60s ^- 



1 Zyklus 
35 Zyklen 
1 Zyklus 



Taq62-40 



96*»C/60s 

96'>C/1 5S-62*C/20S-70'»C/40S 
70**C/60s 



1 Zyklus 
35 Zyklen 
1 Zyklus 



Verwendete Reaktionsbedingungen fur PCR mit Taq-Polymerase: 



50^1 ReaktionsansStze mit 100-200ng Template. 200jiM dNTP, 0.2-0.4 je Primer. 2.5U Ampli-Taq", 5^1 des mit- 



EP 0 892 047 A2 



gelieferten lOx Reaktionspuffers 



Verwendete Programme fur: 



1. XL62-6 (mit Expand-Long Template PGR System^, Boehringer Mannheim, Deutschland) 



5s-62''C/30s-68"C/6min 
94*'C/15s-62«C/30s-68''C/(6min+15s/ZykIus) 
68**C/7min 



1 Zyklus 
lOZyklen 
25 Zyklen 
1 Zyklus 



2. XL62-12 (mit Expand-Long Template PGR System", Boehringer Mannheim, Deutschland) 



94*G/60s 1 Zyklus 

94''G/1 5s-62*G/30s-68*G/12min 1 0 Zyklen 

94'*G/15s-62*G/30s-68"G/(12min+15s/ZykIus) 25 Zyklen 

68'G/7min 1 Zyklus 



Reaktionsbedingungen fur PGR mit Expand-Long Template PGR System 

SOiil Reaktionsans^tze mit 100-200ng Template^ SOOuM dNTP 0.2-0 4 pM je Primer. 0.?5jil Enzym-Mix, 5^i! des 
mitgelieferten 10x Reaktionspuffers Nr. 2. 



Ausgehend von Sequenzen des AHV-Sema (Ensser u. Fleckenstein (1995). J. General Virol. 78: 1063-1067) wur- 
den PCRs und RAGE-PGRs durchgefuhrt Als Ausgangsmaterial hierfur diente humane cDNA aus Plazenta-Gewebe, 
an welche Adapter zur RAGE-Amplifikation ligiert warden (Marathon^-cDNA Amplification Kit, Glontech Laboratories 
GmbH, TullastraRe 4, 69126 Heidelberg, Deutschland). ZunSchst wurde mittels spezrfischer Primer (Nr. 121234 + Nr. 
121236, Tabelle 6) ein PGR-Fragment mit einer L^nge von etwa SOObp (Basenpaaren) amplifiziert (PCR-Programm: 
(Taq60-60))- Dieses wurde kloniert und sequenziert (Taq-Dye-Deoxy-Terminator Sequenzierungs-Kit, Applied Biosy- 
stems, Foster: City. GA USA) Brunnenweg 13, Weildastadt). Die Sequenzierung des PGR-Produkts ergab eine 
Sequenz, die eine hohe Homologie zu der DNA-Sequenz von AHV-Sema aufweist, identisch zu der Sequenz der bei- 
den ESTs. 

Ein PGR-Fragment von 600bp wurde mit dem Primerpaar (Nr. 121237 + Nr. 121239. Tabeile 6) identtfizlert Es 
zeigte sich, das es sich urn Klone mit DNA-Sequenzen des selben Gens handelte. 



Das 800bp PGR-Fragment aus Beispiel 1 wurde radioaktiv markiert (Random-Priming nach der Methode von 
{Feinberg (1983) Anal. Biochem. 132:6-13}. mit ^^P-a-dGTP) und als Sonde fur einen Multi-Tissue Northern-Blot 
(Human Multiple Tissue Northern Bot II. Glontech, Heidelberg, Germany), der mRNA-Proben aus den Geweben Milz. 
Thymus, Prostata, Testis. Ovarien. Dunndarm, Dickdarm und Leukozyten (PBL) enthdit, venwendet. Dabei Zeigte sich 
deutlich die Expression einer mRNA mit einer LSnge von etwa 3.3kb in Milz und Keimdrusen (Hoden, EierstOcken). 
sowie schw^cher in Thymus und Darm. Eine Hybridisierung eines Master-Blots (Dotblot mit RNA aus zahlreichen 
Geweben (Human RNA Master Blot™, Glontech) bestatigte dieses Ergebnis und zeigte auch eine starke Expression in 
Plazenta-Gewebe. 

Die Hybridisierung wurde fur 16 Stunden unter stringenten Bedingungen (5xSSG. 50 mM Na-Phosphat pH 6.8, 50 
% Formamid. 100 ^g/ml Hefe-RNA) bei 42''G durchgefuhrt. Die Blots wurden stringent gewaschen (65''C. 0.2XSSC, 0.1 
% SDS) und einem Fuji BAS2000 Phosphoimager ™ exponiert 



Eine cDNA-Bibliothek aus humaner Milz. kloniert in dem Bakteriophagen Lambda gtIO (Human Spleen 5' 
STRETGH PLUS cDNA, Glontech) wurde mit dieser Sonde durchsucht und ein Lambda-Klon identifiziert. Die in diesem 
Klon inserierte cDNA mit einer LSnge von 1 .6kb wurde mittels PGR (Expand™" Long Template PGR System. Boehringer 
Mannheim GmbH, Sandhofer StraBe 116. 68305 Mannheim) amplifiziert wobei die vektorspezifischen Primer Nr. 
207608 + Nr. 207609 (Tabelle 6) venwerdet wurden (flankierend der EcoRI-Klonierungsstelle) und das erhaltene PGR- 



Beispiel 1: 



Beispiel 2: 



Beispiel 3: 
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Fragment sequenziert. Dieser Klon enthielt das 5' Ende der cDNA und erwerterte die bekannte cDNA Sequenz auch 
nach 3'. Ausgehend von den neuen Teilsequenzen der cDNA wurden neue Primer fur die RACE-PCR entwickelt (Nr. 
232643, Nr. 232644. Nr. 233084, Tabelle 6). Zusammen mrt einer verbesserten Thermocyclertechnik (PTC-200 von 
MJ-Research, Biozym Diagnostik GmbH. 31833 Hess. Oldendorf) mit deutlich besseren Leistungsdaten (Heiz- und 
Kuhlrate) wurde ein 3'-RACE PCR-Produkt amplifiziert wobei die Primer Nr. 232644 bzw. Nr 232643 und AP1 vemen- 
det wurden und in den Vektor pCR2-1 (Invitrogen. De Schelp 12. 9351 NV Leek. Niederlande) kJoniert. Das 3'-RACE 
PCR-Produkt wurde Sequenziert und auf diese Weise das 3'Ende der cDNA identifiziert. Eine RACE-Amplifikation 
nach 5' (Primer Nr. 131990 bzw. Nr. 233084 und API) erweiterte das 5' Ende der cDNA urn wenrge Nukleotide und 
bestatigte den im identifizierten Lambda-Klon gefundenen Aminoterminus des H-SemaL 

Beispiel 4: 

Ausgehend von einem kurzen murinen EST (Zuordnungs-Nr. AA260340) und einem daraus abgeleiteten Primer 
Nr. 260813 (Tabelle 6) und dem H-SemaL spezifischen Primern Nr. 121234 (Tabelle 6) wurde mittels PGR (Bedingun- 
gen: Taq52-60) ein DNA-Fragment mit einer L§nge von ca. 840 bp muriner cDNA amplifiziert und in den Vektor pCR2.1 
kloniert. Das dieses DNA-Fragment enthaltende Gen wurde M-SemaL genannt. Mit dem erhaltenen M-SemaL DNA- 
Fragment eine cDNA-Bank aus MSuse-Milz (Mouse Spleen 5' STRETCH cDNA, Clontech) untersucht. wobei bereits 
mehrere Klone identifiziert werden konnten. 

PCR (Taq60-30) mit den Primern Nr. 260812, Nr.260813 aus muriner. endothelialer cDNA lieferte ein PCR-Frag- 
ment mit einer Lange von 244 Basenpaaren. Die PCR-Ergebnisse zeigten. da8 eine deutliche basale Expression in 
murinen Endothelzellen vorhanden ist. welche nach Stimulation mit dem Zytokin Interferon-y und Lipopolysacchariden 
zunjckgeht 

Beispiel 5: 

Untersuchungen zur Chromosomalen Lokalisation wurden mittels Fluoreszenz in-situ Hybridisierung (FISH) durch- 
gefuhrt. Dazu wurden Metaphase Chromosomen von Mensch und Maus. ausgehend von einer humanen Blutprobe 
bzw. der Mauszeltinie BINE 4.8 (Keyna et aL (1995) J. Immunol. 155, 5536-5542). hergestellt (Kraus et al. (1994) Geno- 
mics 23. 272-274). Die ObjekttrSger wurden mit RNase und Pepsin behandelt (Liehr et al. (1995) Appl. Cytogenetics 
21. 185-188). Fur die Hybridisierung wurden 120 mg humane Nick-translatierte Semaphorin-Probe bzw. 200 mg einer 
entsprechenden Mausprobe verwendet. Die Hybridisierung wurde jeweils in Gegenwart von 4.0 \ig C0T1-DNA und 20 
jug STD bei 37°C (3 Tage) in einer befeuchteten Kammer durchgefuhrt. 

Die Objekttrager wurden mit 50% Formamid/2x SSC (3 mal je 5 min bei 45**C) und dann mit 2 x SSC (3 ma! je 5 
min bei 37''C) gewaschen und die biotinylierte Probe mit dem FITC-Avidin-System (Liehr et al. (1995)), detektiert. Die 
Objekttrager wurden mit Hilfe eines Fluoreszenz -Mikroskops ausgewertet. Es wurden 25 Metaphasen/Probe ausge- 
wertet. wobei jedes Experiment doppelt durchgefuhrt wurde. Es zeigt sich. da 6 H-SemaL auf Chromosom I5q23 loka- 
lisiert ist Chromosomal benachbart liegen der Locus fur das Bardet-Biedl-Sydrom und Tay-Sachs Erkrankung 
(Hexosaminidase A). 

Beispiel 6: 

Die genomische Intron-Exon Struktur des H-SemaL Gens ist zum groBten Teil aufgekiart. 

Genomische DNA Fragmente wurden ausgehend von 250 mg humaner genomischer DNA, die aus PHA stimmu- 
lierten pheripheren Lymphozyten (Blut) isoliert worden waren. amplifiziert. Kurzere Fragmente wurden mit Ampli Taq^ 
(Perkin Elmer). I§ngere Fragmente mit dem Expanded Long Templat PCR System" (Boehringer Mannheim) amplifi- 
ziert. 

Durch PCR-Amplifikation konnte bisher fast der vollstSndige genomische Locus des H-SemaL kloniert und charak- 
terisiert werden. Insgesamt konnten bereits mehr als 8888 bp der genomischen Sequenz bestimmt werden und so die 
Intron-Exon-Struktur des Geris weitgehend aufgeklart werden. 

Beispiel 7: 

Expressionsklonierungen: 

Da kein kompletter Klon des Semaphoringens aus der Lambda-gtIO cDNA-Bank isoliert werden konnte. und auch mit- 
tels PCR ein vollstandiger Klon nicht zu erhalten war, wurde der kodierende Bereich der cDNA in 2 uberlappenen Sub- 
fragmenten mittels PCR (XL62-6) mit Hilfe der Primer Nr. 240655 und Nr. 121339 fur das N-terminale DNA-Fragment. 
sowieden Primern Nr. 240656 (enthait Hindlll und Pmel Schnittstetlen) und Nr. 121234 fur das C-terminale DNA-Frag- 
ment anplifiziert. Die erhaltenen DNA-Fragmente (Subfragmente) wurden in den Vektor pCR21 kloniert. Die beiden 
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Subfragmente wurden komplett sequenziert und schlieBlich die vollstSndige H-SemaL cDNA durch Insertion eines 
0.6kb C-terminalen Sstl-Hindlll Restriktions- Fragments in das mit den Restriktionsenzymen SstI und Hindlll geschnit- 
tene. das N-terminale DNA-Fragment enthaltende Plasmid. hergestellt. Aus diesem Plasmid pCR2. 1 -H-SemaL (gem^B 
Sequenz in Tabelle 7. SEQ ID NO. 34) wurde das komplette Gen mittels der EcoRI-Schnittstelle (in pCR2.l) und Hin- 
dlll-Schnlttstelle (in Primer Nr. 240656, Tabelle 6) herausgeschnitten und in einen entsprechend geschnittenen, konsti- 
tutiven Expressionsvektor pCDNA3.l(-)MycHlsA (Invitrogen) ligiert. Aus dem resultierenden rekombinanten Plasmid 
pCDNA3.1(-)H-SemaL-MycHisA (gemSB Sequenz in Tabelle 8) wurde das EcoRI-Apal Fragment (ohne Myc-His-Tag) 
herausgeschnitten und in den induzierbaren Vektor pIND ligiert (Ecdysone-lnducible Mammalian Expression System. 
Invitrogen). der zuvor ebenfatis mit EcoRI-Apal geschnitten worden war Das rekomlDinante Plasmid wurde mit pIND-H- 
SemaL-EA (Sequenz gem^B Tabelle 11) bezeichnet Ein EcoRI-Pmel-Fragment (mit Myc-His-Tag) aus pCDNA3.1(-)H- 
SemaL-Myc-HisA (Sequenz gemSB Tabelle 9) wurde in einen mit EcoRI-EcoRV geschnittenen Vektor pIND eingesetzt. 
Das rekombinante Plasmid wurde mit pIND-H-SemaL-EE (Sequenz gemSB Tabelle 10) bezeichnet. 
Ein Fusionsgen von H-SemaL mit Enhanced Green Fluorescent Protein (EGFP) wurde hergestellt durch Ligation des 
mit PGR amplrfizierten EGFP-Leserahmens (aus dem Vektor pEGFP-GI (Clontech). mit Hilfe der Primer Nr. 243068 + 
Nr. 243069, Taq52-60) in die Pmel-Schnittstelle des Plasmids pCDNA3.1(-)H-SemaL-MycHisA wodurch das Plasmid 
pCDNA3.1(-)H-SemaL-EGFP-MycHisA (Sequenz gem§B Tabelle 9) erhalten wurde. 

In den Tabellen 7 bis 13 bedeuten kleine Buchstaben die Sequenz von H-SemaL, Teilen oder Derivaten derselben 
und groBe Buchstaben die Sequenz des Plasmids. 

Beispiel 8: 

Zur Hersteliung von H-SemaL spez'rtischen Antikorpern wurden cDNA-Fragmente von H-SemaL in prokaryotische 
Expressionsvektoren integriert, in E. coli exrimiert und die Semaphorin-Derivate aufgereinigt. Die Semaphorin-Derivate 
wurden als Fusionsproteine mit einem His-Tag exprimiert Dementsprechend wurden Vektoren venwendet, die die 
Sequenz fur ein His-Tag enthalten und eine Integration des Semaphorin cDNA-Fragments im Leserahmen ermoglich- 
ten. Ein N-terminales 6xHistidin-Tag ermCglicht z.B, eine Aufreinigung mittels Nickel-Chelat-Affinitatschromalographie 
(Qiagen GmbH, Max-Vdmer StraBe 4. 40724 Hilden): 

1 . Der fur die AminosSuren 179-378 kodierende Teil der H-SemaL cDNA wurde mittels PGR mit den Primern Nr. 
150788 und Nr. 150789 amplifiziert und dieses DNA-Fragment in den Vektor pQE30 (Qiagen). der zuvor mit den 
Restriktionsenzymen BamHI und Hindlll geschnitten worden war, ligiert (Konstrukt pQE39- H-SemaL- BH (Sequenz 
gemaB Tabelle 12)). 

2, Der fur die C-terminalen Aminosauren 480-666 kodierende Abschnitt der H-SemaL cDNA wurde mit den 
Restriktionsenzymen SstI und Hindlll aus dem Plasmid pGR 2.1 geschnitten und in den Vektor pQE31 (Qiagen), 
der zuvor mit SstI und Hindlll geschriitten worden war ligiert (Konstrukt pQE31-H-SemaL-SH (Sequenz gemdB 
Tabelle 13)). 

Die korrekte Integration der Sequenzen im richtigen Leserahmen wurde durch DNA-Sequenzierung uberpruft. Die 
Fusionsproteine, bestehend aus einem N-terminalen 6xHistidin-Taq und einem Teil des Semaphorins H-SemaL wur- 
den mittels Ni^'^-Affinitatschromatographie aufgereinigt. Die aufgereinigten Fusionsproteine wurden zur Immunisierung 
von verschiedenen Tieren (Hase, Huhn, Maus) benutzt 

Beispiel 9: 

FAGS-Analyse verschiedener Zelltypen (Figuren 4 und 5) 
Die Zelten (ca. 0.2-0.5 x 10®) wurden mit FACS-Puffer gewaschen (Phosphate-buffered Saline (PBS) mit 5% fdtalem 
KSIberserum (FGS) und 0.1% Na-Azid) und dann jeweils (auf Eis) fur 1 Stunde mit den Antiseren inkubiert. 
Als primare AntikCrper dienten fur die Kontrolle (Overlay Huhner-Praimmunserum (1 : 50) und fur den spezifischen 
Nachweis (Spezifische FSrbung) ein H-SemaL spezrfisches Huhner- Antiserum (1 : 50). 

Das spezifische Antiserum mit Antikdrpern gegen AminosSuren (Aa) 179-378 (mit N-terminalem His-Tag) von H- 
SemaL wurde durch Immunisierung von Huhnern mit dem durch Ni-Chelat-Aff initatschromatographie gereinigten Pro- 
tein erzeugt (wie in Beispiel 8 beschrieben). 

Als zweiter Antik6rper wurde ein FITC-markierter anti-Huhn F(ab') AntikCrper aus Kaninchen verwendet (Dianova Jack- 
son Laboratories. Besi-Nr. 303-095-006, Hamburg. Deutschland) (Img/ml). 

Fur die CD100-Fartxing: wurde ein Rabbit-anti-Maus IgG, FITC-markiert verwerxlet Der zweite Antikdrper wurde 
jeweils in 1 : 50 Verdunnung in FACS-Puffer eingesetzt. 

Dann wurden die Zellen gewaschen. in PBS resuspendiert und im FAGS analysiert. Die FAGS-Analyse wurde mit 
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einem FACS-Trak Gerat (Becton— Dickinson) durchgefuhrt Prinzip: Eine Einzelzellsuspension wird in einen Messkanal 
vorbeigeleitet. dort werden die Zellen mit Laserlicht von 488nm bestrahit und so Fiuaeszenzfarbstoffe (FITC) angeregt. 
Gemessen werden Streulicht nach vorne {forward scatter. FSC: korreliert mit der ZellgroBe), zur Seite (sideward scat- 
ter SSC: korreliert mit dem Granulargehalt: bei unterschiedlichen Zelltypen unterschiedlich) und Fluoreszenz im Kanal 
1 (FL 1) (fur Welleniangen im FITC Emissionsbereich. max. bei 530nm). Auf diese Weise wurden je 10000 Ereignisse 
(Zellen) gemessen. 

Der Dotplot (Figuren 4a - k) (jeweils linke Abbildung): FSC gegen SSC (GroBe gegen Granulargehalt/Streuung). darin 
etngegrenzt ist die im rechlen Fenster Qeweils zugehorige rechte Abbildung) analysierte (einheitliche) ZeHpopulation 
von Shnlicher Gr63e und Granulargehalt. Das rechte Fenster zeigt die Intensit^t von FL1 (X-Achse) gegen die Zahl der 
Ereignisse (Y-Achse), also eine H^ufigkeitsverteilung. 

Hierbei istjeweils das Ergebnis mit dem Kontrollserum (nichtgefullte Kurve) dem Ergebnis der spezifischen Farbung 
(ausgefutlte Kurve) uberlagert. Eine Verschiebung der Kurve fur die spezifische Farbung gegenuber der Kontrolle nach 
rechts entspricht einer Expression von H-SemaL in den entsprechenden Zellen. Je weiter die Verschiebung. desto star- 
ker ist die Expression. 

Fur FACS Analyse ven^^endete Zellinlen: 

a) Zellinie U937 

American Type Culture Collection ATCC; ATCC Nummer: CRL-1593 Name: U-937 
Gewebe: lymphoma; histiocytic; Monozytenahnlich 
Species: human; 
Hinterleger: H. Koren 

b) Zellinie THP-1 
ATCC Nummer: TlB-202 

Gewebe: monocyte; acute monocytic leukemia 
Species: human 
Hinterleger: S, Tsuchiya 

c) Zellinie K-562 

ATCC Nummer: CCL-243 

Gewebe: chronic myelogenous leukemia 

Species: human; 

Hinterleger H.T. Holden 

d) Zellinie L-428 

DSMZ-Deutsche Sammlung von Mikroorganismen und Zeflkulturen GmbH, DSMZ Nr: ACC 197 
Zelltyp: human Hodgkin's lymphoma 

e) Zellinie Jurkat 

DSMZ-Deutsche Sammlung von Mikroorganismen und zellkulturen GmH, DSMZ Nr: ACC 282 
Zelltyp: human T cell leukemia 

f) Zellinie Daudi 

ATCC Number: CCL-213 

Gewebe: Burkitt's lymphoma; B lymphoblast; B Zellen 
Species : human 
Hinterleger: G. Klein 

g) Zellinie LCL 

EBV-transformierte lymphoWastoide B-Zellinie. 

h) Zellinie Jiyoye (P-2003) 
ATCC Number: CCL-87 

Gewebe: Burkitt's lymphoma; B Zellen; B lymphocyte 
Species: human 
Hinterleger: W. Henle 

i) CBL-Mix57 

humane T-Zellinie (isoliertaus Blut) transformiert mit rekombinantem H. Saimiri (Wild-typ ohne Deletion) 
j) CBL-Mix59 

humane T-Zellinie (isollert aus Blut) transformiert mit H. Samiri (Deletion von 0RF71). 
Beispiel 10: Proteingel und Western-Blot 



Sekretierbare humane SemaL (Aminos§uren 42-549 in Tabelle 4 (ohne Signalpeptid und ohne Transmembrando- 
m^ne) wurde in das Plasmid pMelBac-A (Invitrogen, De Sehelp. Leek, Niederlande. Cv 1950-20) kloniert und auf diese 
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Weise das Plasmid pMelBacA-H-SemaL (Unge 6622bp) erzeugt (Tabelle IS.Figur 8). Das H-SemaL Derivat wurde im 
Baculovirus-System {Bac-N-Blue. Invitrogen) exprimiert. Die Expression wurde in den Insekten-Eizellen abgeleiteten 
Zellinien Sf9 (von Spodoptera flugiperda) und High Five"** (von Trichoplusia ni. U.S. Pat. No. 5,300.435. gekaufl von 
Invitrogen) durch infektion mit den rekombinanten, plaquegereinigten Baculoviren ausgefuhrt. 

Die Expression wurde nach den Angaben des Herstellers durchgefuhrt. 
Anschlie3end wurden die Proteine In einem Gel aufgetrennt und das H-SemaL Derivat im Western-Blot nachgewiesen. 
Die Detektion wurde mit dem H-SemaL spezrfischen HQhnerantiserum (vergl. Beispiel 8 und Figur 7) (Verdunnung: 
1:100) durchgefuhrt. Der spezifische Huhnerantikdrper wurde mit anti-lgY-HRP Konjugat (Verdunpung: 1:3000, vom 
Kaninchen; Dianova Jackson Laberatories) nach Angaben des Herstellers nachgewiesen. 

Beispiel 1 1 : Herstellung von pMelBacA-HSEMAL 

Der rekombinante Vektor (pMelBacA-HSEMAL. 6622bp) wurde hergestellt. indem ein entsprechendes DNA-Frag- 
ment. das fur die AminosSuren 42-649 von H-SemaL kodiert, in den Vektor pMelBacA (4.8 kb. Invitrogen) Woniert 
wurde (vergl. Annotation zu pMelBacA-H-SemaL). Die Klonierung erfolgte uber BamHI und EcoRI in frame hinter die in 
dem Vektor vorliegende Signalsequenz (Jioneybee melittin signal sequence"). Ein entsprechendes H-SemaL DNA- 
Fragment wurde mit dem Primerpaar H-Sema 1 baculo 5' und H-Sema 1 bacuio 3' amplif iziert. 

Primer zur Amplifikation (TaKaRa Ex Taq- Polymerase) und Klonierung: 
„H-Sema 1 baculo 5'„ zur Anrtplifikation ohne Signalsequenz und zur Einfuhrung einer BamHI-Schnittstelle 
5'-CCGGATCCGCCCAGGGCCACCTAAGGAGCGG-3' (SEQ ID NO: 43) 

, H-Sema 1 baculo 3'„ zur Anrrplifikation ohne Transmembrandomane und zur EinfOhrung einer EcoR!-Schnittste!le 
5'-CTGAATTCAGGAGCCAGGGCACAGGCATG-3' (SEQ ID NO: 44). ' 

Abbildungen: 

Figur 1 : 

Gewebespezifische Expression von H-SemaL 

A) Mehrfach-Gewebe Northern Blot (Clontech, Heidelberg. Deutschland). Von links nach rechts sind aufgetragen: 
Je 2 ng Poly-A-RNA pro Spur aus Milz, Thymus, Prostata. Hoden. Eierstocken, Dunndarm, Dickdarm Mukosa, phe- 
ripheren (Blut-) Leukozyten. GroBenstandards sind markiert. 

Die Blots wurden unter stringenten Bedingungen mit einer 800 Basenpaaren langen H-SemaL Probe hybridislert. 
Figur 2: 

Schematische Darstellung der Klonierung der H-SemaL cDNA und der genomischen Organisation der H-SemaL 
kodierenden Sequenzen (H-SemaL Gen) 

Oben: Lokalisation der EST-Sequenzen (Zugangsnummern; Lage der EST-Sequenzen ist relativ zur AHV-Sema 
Sequenz dargestellt). 

Darunter: Amplifizierte PGR- und RACE-Produkte sowie die Position der cDNA Klone im Bezug auf die Lokalisation in 
der vollstandigen H-SemaL cDNA und dem offenen Leserahmen (ORF) fur das kodierte Protein. 
Unten: Relative Position der Exons im H-SemaL Gen im Bezug auf die genomische Sequenz. 
Die Position der verwendeten Oligonukleotid Primer ist durch Pfeile angezeigt 

Figur 3: 

Phylogenetischer Baum: Erhalten durch mehrfaches Alignment der aufgefuhrten Semaphorin Sequenzen. Auf- 
grund der Grupplerung der Semaphorine in dem phylogenetischen Baum kann auf deren phylogenetische Venw^andt- 
schaft geschlossen werden. 

Figur 4: 

FACS Analyse der H-SemaL Expression in verschiedenen Zellinien bzw. verschiedenen Zelltypen (vergl. Beispiel 

8). 
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Figur 5: 

Vergleichende Analyse der CD 100 und H-SemaL Expression (vergl. Beispiel 9). 

Figur 6: Expression von sekretierbarem humanen SEMAL (H-SemaL) in HiFive und Sf3-Ze!len (vergL Beispiel 10). 

(Aa 42-649 in pMelBac-A (Invitrogen) im Baculovirus-System (Bac-N-Blue. Invitrogen) Detektion mit spezif ischem 
Huhner-Antiserum (1 :100) und anti-IgY-HRP Konjugat (1 ;3000. vom Kaninchen. Jackson Lab.) 
1,4,6 uninfizierte HiFive Zellen (serumfrei) 

2,3,5,7.8 mit rekombinantem Baculovirus infizierte HiFive Zellen (serumfrei) 
M Rainbow molecular weight marker (Amersham RPN756) 
9,10 infizierte Sf9 Zellen (serumhaltiges Medium). 

Figur 7: Spezif itat des Antiserums 

Spuren 1-3: Huhn 1; Spuren 4-6: Huhn 2 
Spuren 1 und 4: Praimmunserum 
Spuren 2 und 5: 60. Immunisierungstag 
Spuren 4 und 6: 105. Immunisierungstag 

Immunisiert wurde mit den Aminosauren 179-378 von H-SemaL (mit aminoterminalem His-Tag) (vergl Beispiel 8 
Punkt 1.) 

Figur 8: Abbildung der Plasmidkarte von pMelBacA-HSEMAL 

Das rekombinante Plasmid wurde wie in Beispiel 1 1 beschrieben. hergestellt. 
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Spezies 


Maus 


Maus 


Maus 


Maus 


(D 
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Huhn 


Huhn 


Huhn 


Huhn 


Huhn 


Ratte 


Tribolium 
confusum 


C.eiegans 


Grashiipfer 


Drosophila 


Drosophila 


AHV-1 
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Synonym 


M-Sema-F 


M-SemaG 






Semal 


















Fascidin-IV 
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Name 


<N 
Ll- 
« 

E 
a> 
CO 

2 


M-SemaGI 


M-SemaH 


M-SemaVIa 


M-SemaL 


Collapsin-1 


Collapsin-2 


Collapsin-3 


Collapsin-4 


Collapsin-5 


R-Sema III 


T-Sema 1 


Ce-Sema 1 


G-Sema 1 


D-Sema 1 


D-Sema II 


AHV-Sema 
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Tabelle 2: cONA-Sequenz von H-SemaL (2636 Nukleolide) (SEQ ID NO.: 1 ) 

1 cggggccacg ggatgacgcc tcctccgccc ggacgtgccg cccccagcgc 

51 accgcgcgcc cgcgtccctg gcccgccggc tcggttgggg cttccgctgc 

101 ggctgcggct gctgctgctg ctctgggcgg ccgccgcctc cgcccagggc 

151 cacctaagga gcggaccccg catcttcgcc gtctggaaag gccatgtagg 

201 gcaggaccgg gtggactttg gccagactga gccgcacacg gtgcttttcc 

251 acgagccagg cagctcctct gtgtgggtgg gaggacgtgg caaggtctac 

301 ctctttgact tccccgaggg caagaacgca tctgtgcgca cggtgaatat 
cggctccaca aaggggtcct gtctggataa gcgggactgc gagaactaca 

401 tcactctcct ggagaggcgg agtgaggggc tgctggcctg tggcaccaac 

451 gcccggcacc ccagctgctg gaacctggtg aatggcactg tggtgccact 

501 tggcgagatg agaggctacg cccccttcag cccggacgag aactccctgg 

551 ttctgtttga aggggacgag gtgtattcca ccatccggaa gcaggaatac 

601 aatgggaaga tccctcggtt ccgccgcatc cggggcgaga gtgagctgta 

651 caccagtgat actgtcatgc agaacccaca gttcatcaaa gccaccatcg 

701 tgcaccaaga ccaggcttac gatgacaaga tctactactt cttccgagag 

751 gacaatcctg acaagaatcc tgaggctcct ctcaatgtgt cccgtgtggc 

801 ccagttgtgc aggggggacc agggtgggga aagttcactg tcagtctcca 

851 agtggaacac ttttctgaaa gccatgctgg tatgcagtga tgctgccacc . 

aacaagaact tcaacaggct gcaagacgtc ttcctgctcc ctgaccccag 

951 cggccagtgg agggacacca gggtctatgg tgttttctcc aacccctgga 

1001 actactcagc cgtctgtgtg tattccctcg gtgacattga caaggtcttc 

1051 cgtacctcct cactcaaggg ctaccactca agccttccca acccgcggcc 

1101 tggcaagtgc ctcccagacc agcagccgat acccacagag accttccagg 

1151 tggctgaccg tcacccagag gtggcgcaga gggtggagcc catggggcct 
ctgaagacgc cattgttcca ctctaaatac cactaccaga aagtggccgt 



30 



35 



1201 



1251 tcaccgcatg caagccagcc acggggagac ctttcatgtg ctttacctaa 

1301 ctacagacag gggcactatc cacaaggtgg tggaaccggg ggagcaggag 

1351 cacagcttcg ccttcaacat catggagatc cagcccttcc gccgcgcggc 

1401 tgccatccag accatgtcgc tggatgctga gcggaggaag ctgtatgtga 

1451 gctcccagtg ggaggtgagc caggtgcccc tggacctgtg tgaggtctat 

1501 ggcgggggct gccacggttg cctcatgtcc cgagacccct actgcggctg 

1551 ggaccagggc cgctgcatct ccatctacag ctccgaacgg tcagtgctgc 

1601 aatccattaa tccagccgag ccacacaagg agtgtcccaa ccccaaacca 

1651 gacaaggccc cactgcagaa ggtttccctg gccccaaact ctcgctacta 

1701 cctgagctgc cccatggaat cccgccacgc cacctactca tggcgccaca 
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1751 aggagaacgt ggagcagagc tgcgaacctg gtcaccagag ccccaactgc 

1801 atcctgttca tcgagaacct cacggcgcag cagtacggcc actacttctg 

1851 cgaggcccag gagggctcct acttccgcga ggctcagcac tggcagctgc 

1901 tgcccgagga cggcatcatg gccgagcacc tgctgggtca tgcctgtgcc 

1951 ctggctgcct ccctctggct gggggtgctg cccacactca ctcttggctt 

2001 gctggtccac tagggcctcc cgaggctggg catgcctcag gcttctgcag 

2051 cccagggcac tagaacgtct cacactcaga gccggctggc ccgggagctc 

2101 cttgcctgcc acttcttcca ggggacagaa taacccagtg gaggatgcca 

2151 ggcctggaga cgtccagccg caggcggctg ctgggcccca ggtggcgcac 

2201 ggatggtgag gggctgagaa tgagggcacc gactgtgaag ctggggcatc 

,5 2251 gatgacccaa gactttatct tctggaaaat atttttcaga ctcctcaaac 

2301 ttgactaaat gcagcgatgc tcccagccca agagcccatg ggtcggggag 

2351 tgggtttgga taggagagct gggactccat ctcgaccctg gggctgaggc 

2401 ctgagtcctt ctggactctt ggtacccaca ttgcctcctt cccctccctc 

20 2451 tctcatggct gggtggctgg tgttcctgaa gacccagggc taccctctgt 

2501 ccagccctgt cctctgcagc tccctctctg gtcctgggtc ccacaggaca 

2551 gccgccttgc atgtttattg aaggatgttt gctttccgga cggaaggacg 

2601 gaaaaagctc tgaaaaaaaa aaaaaaaaaa aaaaaa 

25 



Tabelle 3: Nukleolidsequenz der cONA von M-SemaL (partiell, 1 195 Nukleotide) 
(SEQ ID NO.: 2) 



1 


cggggctgcg 


ggatgacgcc 


51 


accgcgcgcc 


cgcgtcctca 


101 


ggctgcggct 


tctgctggtg 


151 


cactcgagga 


gcggaccccg 


201 


tgtggacttt 


agccagcctg 


251 


gcagcttctc 


tgtctgggtg 


301 


ttccccgagg 


gcaagaatgc 


351 


aaaggggtcc 


tgtcaggaca 


401 


tagaaaggcg 


gggtaatggg 


451 


cccagctgct 


ggaacttggt 


501 


gatgaaaggc 


tatgccccct 


551 


ttgaaggaga 


tgaagtgtac 


601 


aagatccctc 


ggtttcgacg 


651 


tgatacagtc 


atgcagaacc 


701 


aagaccaagc 


ctatgatgat 


751 


cctgacaaga 


accccgaggc 



tcctcctccc ggacgtgccg cccccagcgc 
gcctgccggc tcggttcggg ctcccgctgc 
ttctgggtgg ccgccgcctc cgcccaaggc 
catctccgcc gtctggaaag ggcaggacca 
agccacacac cgtgcttttc catgagccgg 
ggtggacgtg gcaaggtcta ccacttcaac 
ctctgtgcgc acggtgaaca tcggctccac 
aacaggactg tgggaattac atcactcttc 
ctgctggtct gtggcaccaa tgcccggaag 
gaatgacagt gtggtgatgt cacttggtga 
tcagcccgga tgagaactcc ctggttctgt 
tctaccatcc ggaagcagga atacaacggg 
cattcggggc gagagtgaac tgtacacaag 
cacagttcat caaggccacc attgtgcacc 
aagatctact acttcttccg agaagacaac 
tcctctcaat gtgtcccgag tagcccagtt 
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10 



801 gtgcaggggg gaccagggtg gtgagagttc gttgtctgtc tccaagtgga 

851 acaccttcct gaaagccatg ttggtctgca gcgatgcagc caccaacagg 

901 aacttcaatc ggctgcaaga tgtcttcctg ctccctgacc ccagtggcca 

951 gtggagagat accagggtct atggcgtttt ctccaacccc tggaactact 

1001 cagctgtctg cgtgtattcg cttggtgaca ttgacagagt cttccgtacc 

1051 tcatcgctca aaggctacca catgggcctt tccaaccctc gacctggcat 

1101 gtgcctccca aaaaagcagc ccatacccac agaaaccttc caggtagctg 

1151 atagtcaccc agaggtggct cagagggtgg aacctatggg gcccc 



Tabelle 4: Aminosauresequenz von H-SemaL (666 Aminosauren) 
(SEQ ID NO.: 3) 



20 


1 


MTPPPPGRAA 


PSAPRARVPG 


PPARLGLPLR 


LRLLLLLWAA 


AASAQGHLRS 




51 


GPRIFAVWKG 


HVGQDRVDFG 


QTEPHTVLFH 


EPGSSSVWVG 


GRGKVYLFDF 




101 


PEGKNASVRT 


VNIGSTKGSC 


LDKRiXENYI 


TLLERRSEGL 


LACGTNARHP 




151 


SCWNLVNGTV 


VPLGEMRGYA 


PFSPDENSLV 


LFEGDEVYST 


IRKQEYNGKI 


25 


201 


PRFRRIRGES 


ELYTSDTVMQ 


NPQFIKATIV 


HQDQAYDDKI 


YYFFREDNPD 




251 


KNPEAPLIfVS 


RVAQLCRGDQ 


GGESSLSVSK 


WNTFLKAMLV 


CSDAATNKNF 




301 


NRLQDVFXLP 


DPSGQWRDTR 


VYGVFSNPWN 


YSAVCVYSLG 


DIDKVFRTSS 




351 


LKGYHSSLPN 


PRPGKCLPDQ 


QPIPTETFQV 


ADRHPEVAQR 


VEPMGPLKTP 


30 


401 


LFHSKYHYQK 


VAVHRMQASH 


GETFHVLYLT 


TDRGTIHKW 


EPGEQEHSFA 




451 


FNIMEIQPFR 


RAAAIQTMSL 


DAERRKLYVS 


SQWEVSQVPL 


DLCEVYGGGC 




501 


HGCLMSRDPY 


CGWDQGRCIS 


lYSSERSVLQ 


SINPAEPHKE 


CPNPKPDKAP 




551 


LQKVSLAPNS 


RYYLSCPMES 


RHATYSWRHK 


ENVEQSCEPG 


HQSPNCILFI 


35 


601 


ENLTAQQYGH 


YFCEAQEGSY 


FREAQHWQLL 


PEDGIMAEHL 


LGHACALAAS 




651 


LWLGVLPTLT 


LGLLVH 









(Partielle) Aminosauresequenz von M-SemaL (394 Aminosauren, entsprichl Position 1-396 von 
H-SemaL) (SEQ ID NO.: 4) 

1 MTPPPPGRAA PSAPRARVLS LPARFGLPLR LRLLLVFWVA AASAQGHSRS 

51 GPRISAVWKG QDKVDFSQPE PHTVLFHEPG SFSVWVGGRG KVYHFNFPEG 

101 KNASVRTVNI GSTKGSCQDK QDCGNYITLL ERRGNGLLVC GTNARKPSCW 

151 NLVNDSWMS LGEMKGYAPF SPDENSLVLF EGDEVYSTIR KQEYNGKIPR 

201 FRRIRGESEL YTSDTVMQNP QFIKATIVHQ DQAYDDKIYY FFREDNPDKN 

251 PEAPLNVSRV AQLCRGDQGG ESSLSVSKWN TFLKAMLVCS DAATNRNFNR 
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Tabeile 5: 
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301 LQDVFLLPDP SGQWRDTRVY GVFSNPWNYS AVCVYSLGDI DRVFRTSSLK 
351 GYHMGLSNPR PGMCLPKKQP IPTETFQVAD SHPEVAQRVE PMGP 



Tabelle 6: Synthetische Oligonukleotkie, (Eurogentec, Seraing, Belgien) 

Nummer des Nukleotidsequenz des Primers (der synthetischea 
Primers/ Be zeichnung Oligonukleotide) 

91506/AP2 actcactatagggctcgagcggc (SEQ ID NO.: 5) 

121234 agccgcacacggtgcttttc (SEQ ID NO.: 6) 

121235/Est 2 gcacagatgcgttcttgccc (SEQ ID NO.: 7) 

121236/Est 3 accatagaccctggtgtccc (SEQ ID NO.: 8) 

121237/Est 4 gcagtgatgctgccaccaac (SEQ ID NO.: 9) 

121238 ccagaccatgtcgctggatg (SEQ ID NO.: 10) 
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10 



15 



20 



25 



30 



35 



acatgaggcaaccqtqgcaq 




TD 


MO 


1 1 ^ 


ccatcctaatacgactcactatagggc 




T n 






aggtagaccttgccacgtcc 


\ *J t* V 


I D 






gaacttcaacaggctgcaagacg 


f SEO 


TD 


MO 




atgctgagcggaggaagctg 


(SEQ 


ID 


NO. 




ccgccatacacctcacacag 


(SEQ 


ID 


NO. : 


16) 


ctggaagctttctgtgggtatcggctgc 


(SEQ 


ID 


NO. : 


17) 


tttggatccctggttctgtttgaag 


(SEQ 


ID 


NO. : 


18) 



121239/Est 6 
I31989/AP1 
131990/Est 7 
131991 
131992 
131993 
150788 
150789 
167579/cDNA 

ttctagaattcagcggccgcttttttttttttttttttttttttttttttvn 
Synthese Primer (SEQ ID NO.: 19) 

^^9^21 ggggaaagttcactgtcagtctccaag 

168 422 gggaatacacacagacggctgagtag 

2 07 608/ agcaagttcagcctggttaagt 

Amplif ilcation von XgtlO Insert 

207 609/ ttcitgagtatttcttccaggg 

Axnplif ikation von Xgt 10 Insert 



(SEQ ID NO. 
(SEQ ID NO. 
(SEQ ID NO. 



232643/Est 13 
232644/Est 14 
233084 
240655/hs 5 
240656/hs 3 
240657/hs 3c 
243068 
243069 
260812 
260813 



20) 
21) 

22) 



(iitQ ID NO. : 23) 



ccattaatccagccgagccacacaag (SEQ ID NO.: 24) 

catctacagctccgaacggtcagtg (SEQ ID NO. : 25) 

cagcggaagccccaaccgag (SEQ ID NO. : 26) 

gggatgacgcctcctccgcccgg (SEQ ID NO.: 27) 
aagcttcacgtggaccagcaagccaagagtg (SEQ ID NO.: 28) 

aagctttttccgtccttccgtccgg (SEQ ID NO.:. 29) 

atggtgagcaagggcgaggagctg (SEQ ID NO.: 30) 

cttgtacagctcgtccatgccgag (SEQ ID NO.: 31) 

GGGTGGTGAGAGTTCGTTGTCTGTC (SEQ ID NO.: 32) 

GAGCGATGAGGTACGGAAGACTCTG (SEQ ID NO.: 33) 



40 



Tabelle 7: NuWeotidsequenz des rekombinanten Rasmids pCR2, 1 -H-SemaL (SEQ ID NO.: 34) 



45 



50 



1 AGCGCCCAAT 
51 TGCAGCTGGC 
101 CGCAATTAAT 
151 TTATGCTTCC 
201 CACACAGGAA 
251 gcaagccaag 
301 agggcacagg 
351 cagcagctgc 
401 cgcagaagta 



ACGCAAACCG 
ACGACAGGTT 
GTGAGTTAGC 
GGCTCGTATG 
ACAGCTATGA 
agtgagtgtg 
catgacccag 
cagtgctgag 
gtggccgtac 



CCTCTCCCCG 
TCCCGACTGG 
TCACTCATTA 
TTGTGTGGAA 
CCATGATTAC 
ggcagcaccc 
caggtgctcg 
cctcgcggaa 
tgctgcgccg 



CGCGTTGGCC 
AAAGCGGGCA 
GGCACCCCAG 
TTGTGAGCGG 
GCCaagcttc 
ccagccagag 
gccatgatgc 
gtaggagccc 
tgaggttctc 



GATTCATTAA 
GTGAGCGCAA 
GCTTTACACT 
ATAACAATTT 
acgtggacca 
ggaggcagcc 
cgtcctcggg 
tcctgggcct 
gatgaacagg 
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451 atgcagttgg ggctctggtg 
501 cttgtggcgc catgagtagg 
551 "ggtagtagcg agagtttggg 
601 tctggtttgg ggttgggaca 
651 ttgcagcact gaccgttcgg 
701 cccagccgca gtaggggtct 
751 ccatagacct cacacaggtc 
801 gctcacatac agcttcctcc 
851 cagccgcgcg gcggaagggc 
901 tgctcctgct cccccggttc 
951 agttaggtaa agcacatgaa 
1001 gaacggccac tttctggtag 
1051 agaggcccca tgggctccac 
1101 cacctggaag gtctctgtgg 
1151 caggccgcgg gttgggaagg 
1201 cggaagacct tgtcaatgtc 
1251 gttccagggg ttggagaaaa 
1301 cgctggggtc agggagcagg 
1351 ttggtggcag catcactgca 
1401 cttggagact gacagtgaac 
1451 gggccacacg ggacacattg 
1501 tcctctcgga agaagtagta 
1551 cacgatggtg gctttgatga 
1601 tgtacagctc actctcgccc 
1651 ttgtattcct gcttccggat 
1701 aaccagggag ttctcgtccg 
1751 caagtggcac cacagtgcca 
1801 gcgttggtgc cacaggccag 
1851 gatgtagttc tcgcagtccc 
1901 cgatattcac cgtgcgcaca 
1951 aggtagacct tgccacgtcc 
2001 gtggaaaagc accgtgtgcg 
2051 gccctacatg gcctttccag 
2101 tggccctggg cggaggcggc 
2151 ccgcagcgga agccccaacc 
2201 gtgcgctggg ggcggcacgt 
2251 attcTGCAGA TATCCATCAC 
2 301 GGCCCAATTC GCCCTATAGT 
2 351 TTACAACGTC GTGACTGGGA 



accaggttcg cagctctgct ccacgttctc 
tggcgtggcg ggattccatg gggcagctca 
gccagggaaa ccttctgcag tggggccttg 
ctccttgtgt ggctcggctg gattaatgga 
agctgtagat ggagatgcag cggccctggt 
cgggacatga ggcaaccgtg gcagcccccg 
caggggcacc tggctcacct cccactggga 
gctcagcatc cagcgacatg gtctggatgg 
tggatctcca tgatgttgaa ggcgaagctg 
caccaccttg tggatagtgc ccctgtctgt 
aggtctcccc gtggctggct tgcatgcggt 
tggtatttag agtggaacaa tggcgtcttc 
cctctgcgcc acctctgggt gacggtcagc 
gtatcggctg ctggtctggg aggcacttgc 
cttgagtggt agcccttgag tgaggaggta 
accgagggaa tacacacaga cggctgagta 
caccatagac cctggtgtcc ctccactggc 
aagacgtctt gcagcctgtt gaagttcttg 
taccagcatg gctttcagaa aagtgttcca 
tttccccacc ctggtccccc ctgcacaact 
agaggagcct caggattctt gtcaggattg 
gatcttgtca tcgtaagcct ggtcttggtg 
actgtgggtt ctgcatgaca gtatcactgg 
cggatgcggc ggaaccgagg gatcttccca 
ggtggaatac acctcgtccc cttcaaacag 
ggctgaaggg ggcgtagcct ctcatctcgc 
ttcaccaggt tccagcagct ggggtgccgg 
cagcccctca ctccgcctct ccaggagagt 
gcttatccag acaggacccc tttgtggagc 
gatgcgttct tgccctcggg gaagtcaaag 
tcccacccac acagaggagc tgcctggctc 
gctcagtctg gccaaagtcc acccggtcct 
acggcgaaga tgcggggtcc gctccttagg 
ggccgcccag agcagcagca gcagccgcag 
gagccggcgg gccagggacg cgggcgcgcg 
ccgggcggag gaggcgtcat cccaagccga 
ACTGGCGGCC GCTCGAGCAT GCATCTAGAG 
GAGTCGTATT ACAATTCACT GGCCGTCGTT 
AAACCCTGGC GTTACCCAAC TTAATCGCCT 



EP 0 892 047 A2 



2 4 01 TGCAGCACAT CCCCCTTTCG CCAGCTGGCG TAATAGCGAA GAGGCCCGCA 
2 451 CCGATCGCCC TTCCCAACAG TTGCGCAGCC TGAATGGCGA ATGGGACGCG 
2501 CCCTGTAGCG GCGCATTAAG CGCGGCGGGT GTGGTGGTTA CGCGCAGCGT 
2551 GACCGCTACA CTTGCCAGCG CCCTAGCGCC CGCTCCTTTC GCTTTCTTCC 
2 601 CTTCCTTTCT CGCCACGTTC GCCGGCTTTC CCCGTCAAGC TCTAAATCGG 
2 651 GGGCTCCCTT TAGGGTTCCG ATTTAGAGCT TTACGGCACC TCGACCGCAA 
2701 AAAACTTGAT TTGGGTGATG GTTCACGTAG TGGGCCATCG CCCTGATAGA 
2751 CGGTTTTTCG CCCTTTGACG TTGGAGTCCA CGTTCTTTAA TAGTGGACTC 
2 801 TTGTTCCAAA CTGGAACAAC ACTCAACCCT ATCGCGGTCT ATTCTTTTGA 
2 851 TTTATAAGGG ATTTTGCCGA TTTCGGCCTA TTGGTTAAAA AATGAGCTGA 
2901 TTTAACAAAT tCAGGGCGCA AGGGCTGCTA AAGGAACCGG AACACGTAGA 

2 951 AAGCCAGTCC GCAGAAACGG TGCTGACCCC GGATGAATGT CAGCTACTGG 
3001 GCTATGTGGA CAAGGGAAAA CGCAAGCGCA AAGAGAAAGC AGGTAGCTTG 
3051 CAGTGGGCTT ACATGGCGAT AGCTAGACTG GGCGGTTTTA TGGACAGCAA 
3101 GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT TGGGAAGCCC 
3151 TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG 
32 01 GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGCATGATTG 
3251 AACAAGATGG ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA 
3301 TTCGGCTATG ACTGGGCACA ACAGACAATC GGCTGCTCTG ATGCCGCCGT 
3351 GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC AAGACCGACC 

3 401 TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG GCTATCGTGG 
3451 CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA 
3 501 AGCGGGAAGG GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC 
35 51 TGTCATCTCG CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGCTGATGCA 
3 601 ATGCGGCGGC TGCATACGCT TGATCCGGCT ACCTGCCCAT TCGACCACCA 
3 651 AGCGAAACAT CGCATCGAGC GAGCACGTAC TCGGATGGAA GCCGGTCTTG 

37 01 TCGATCAGGA TGATCTGGAC GAAGAGCATC AGGGGCTCGC GCCAGCCGAA 
3751 CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT 

38 01 GATCCATGGC GATGCCTGCT TGCCGAATAT CATGGTGGAA AATGGCCGCT 
38 51 TTTCTGGATT CAACGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG 
3 901 GACATAGCGT TGGATACCCG TGATATTGCT GAAGAGCTTG GCGGCGAATG 

3 951 GGCTG^^CGC TTCCTCGTGC TTTACGGTAT CGCCGCTCCC GATTCGCAGC 
4001 GCATCGCCTT CTATCGCCTT CTTGACGAGT TCTTCTGAAT TGAAAAAGGA 
4051 AGAGTATGAG TATTCAACAT TTCCGTGTCG CCCTTATTCC CTTTTTTGCG 
4101 GCATTTTGCC TTCCTGTTTT TGCTCACCCA GAAACGCTGG TGAAAGTAAA 
4151 AGATGCTGAA GATCAGTTGG GTGCACGAGT GGGTTACATC GAACTGGATC 
4201 TCAACAGCGG TAAGATCCTT GAGAGTTTTC GCCCCGAAGA ACGTTTTCCA 

4 2 51 ATGATGAGCA CTTTTAAAGT TCTGCTATGT CATACACTAT TATCCCGTAT 
4 301 TGACGCCGGG CAAGAGCAAC TCGGTCGCCG GGCGCGGTAT TCTCAGAATG 
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4351 


ACTTGGTTGA 


GTACTCACCA 


GTCACAGAAA 


AGCATCTTAC 


GGATGGCATG 




4401 


ACAGTAAGAG 


AATTATGCAG 


TGCTGCCATA 


ACCATGAGTG 


ATAACACTGC 


5 


4451 


GGCCAACTTA 


CTTCTGACAA 


CGATCGGAGG 


ACCGAAGGAG 


CTAACCGCTT 




4501 


TTTTGCACAA 


CATGGGGGAT 


CATGTAACTC 


GCCTTGATCG 


TTGGGAACCG 




4551 


GAGCTGAATG 


AAGCCATACC 


AAACGACGAG 


AGTGACACCA 


CGATGCCTGT 




4601 


AGCAATGCCA 


ACAACGTTGC 


GCAAACTATT 


AACTGGCGAA 


CTACTTACTC 


W 


4651 


TAGCTTCCCG 


GCAACAATTA 


ATAGACTGGA 


TGGAGGCGGA 


TAAAGTTGCA 




4701 


GGACCACTTC 


TGCGCTCGGC 


CCTTCCGGCT 


GGCTGGTTTA 


TTGCTGATAA 




4751 


ATCTGGAGCC 


GGTGAGCGTG 


GGTCTCGCGG 


TATCATTGCA 


GCACTGGGGC 




4801 


CAGATGGTAA 


GCCCTCCCGT 


ATCGTAGTTA 


TCTACACGAC 


GGGGAGTCAG 


15 


4851 


GCAACTATGG 


ATGAACGAAA 


TAGACAGATC 


GCTGAGATAG 


GTGCCTCACT 




4901 


GATTAAGCAT 


TGGTAACTGT 


CAGACCAAGT 


TTACTCATAT 


ATACTTTAGA 




4951 


TTGATTTAAA 


ACTTCATTTT 


TAATTTAAAA 


GGATCTAGGT 


GAAGATCCTT 




5001 


TTTGATAATC 


TCATGACCAA 


AATCCCTTAA 


CGTGAGTTTT 


CGTTCCACTG 


20 


5051 


AGCGTCAGAC 


CCCGTAGAAA 


AGATCAAAGG 


ATCTTCTTGA 


GATCCTTTTT 




5101 


TTCTGCGCGT 


AATCTGCTGC 


TTGCAAACAA 


AAAAACCACC 


GCTACCAGCG 




5151 


GTGGTTTGTT 


TGCCGGATCA 


AGAGCTACCA 


ACTCTTTTTC 


CGAAGGTAAC 




5201 


TGGCTTCAGC 


AGAGCGCAGA 


TACCAAATAC 


TGTCCTTCTA 


GTGTAGCCGT 


25 


5251 


AGTTAGGCCA 


CCACTTCAAG 


AACTCTGTAG 


CACCGCCTAC 


ATACCTCGCT 




5301 


CTGCTAATCC 


TGTTACCAGT 


GGCTGCTGCC 


AGTGGCGATA 


AGTCGTGTCT 




5351 


TACCGGGTTG 


GACTCAAGAC 


GATAGTTACC 


GGATAAGGCG 


CAGCGGTCGG 


30 


5401 


GCTGAACGGG 


GGGTTCGTGC 


ACACAGCCCA 


GCTTGGAGCG^ AACGACCTAC 


5451 


ACCGAACTGA 


GATACCTACA 


GCGTGAGCAT 


TGAGAAAGCG 


CCACGCTTCC 




5501 


CGAAGGGAGA 


AAGGCGGACA 


GGTATCCGGT 


AAGCGGCAGG 


GTCGGAACAG 




5551 


GAGAGCGCAC 


GAGGGAGCTT 


CCAGGGGGAA 


ACGCCTGGTA 


TCTTTATAGT 


35 


5601 


CCTGTCGGGT 


TTCGCCACCT 


CTGACTTGAG 


CGTCGATTTT 


TGTGATGCTC 




5651 


GTCAGGGGGG 


CGGAGCCTAT 


GGAAAAACGC 


CAGCAACGGG 


GCCTTTTTAC 




5701 


GGTTCCTGGC 


CTTTTGCTGG 


CCTTTTGCTC 


ACATGTTCTT 


TCCTGCGTTA 




5751 


TCCCCTGATT 


CTGTGGATAA 


CCGTATTACC 


GCCTTTGAGT 


GAGCTGATAC 


40 


5801 
5851 


CGCTCGCCGC 
CGGAAG 


AGCCGAACGA 


CCGAGCGCAG 


CGAGTCAGTG 


AGCGAGGAAG 



Tabelle 8: Nukleotidsequenz des rekombinanten Expressionspiasmkjs pCDNA3. 1 (-)H-SemaL-MycHisA 
(SEQIDNO.: 35) 

1 GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC 
51 TGCTCTGATG CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT 
101 GGAGGTCGCT GAGTAGTGCG CGAGCAAAAT TTAAGCTACA ACAAGGCAAG 
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151 GCTTGACCGA CAATTGCATG AAGAATCTGC TTAGGGTTAG GCGTTTTGCG 
2 01 CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT GATTATTGAC 
2 51 TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA 
301 TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG 
351 CCCAACGACC CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT 
401 AACGCCAATA GGGACTTTCC ATTGACGTCA ATGGGTGGAC TATTTACGGT 
4 51 AAACTGCCCA CTTGGCAGTA CATCAAGTGT ATCATATGCC AAGTACGCCC 
501 CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT ATGCCCAGTA 
551 CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 
601 TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA 
651 TAGCGGTTTG ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA 
701 TGGGAGTTTG TTTTGGCACC AAAATCAACG GGACTTTCCA AAATGTCGTA 
751 ACAACTCCGC CCCATTGACG CAAATGGGCG GTAGGCGTGT ACGGTGGGAG 
8 01 GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA CTGCTTACTG 
851 GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC 
901 GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT 
951 GCAgaattcg gcttgggatg acgcctcctc cgcccggacg tgccgccccc 
1001 agcgcaccgc gcgcccgcgt ccctggcccg ccggctcggt tggggcttcc 
1051 gctgcggctg cggctgctgc tgctgctctg ggcggccgcc gcctccgccc 
1101 agggccacct aaggagcgga ccccgcatct tcgccgtctg gaaaggccat 
1151 gtagggcagg accgggtgga ctttggccag actgagccgc acacggtgct 
1201 tttccacgag ccaggcagct cctctgtgtg ggtgggagga cgtggcaagg 
1251 tctacctctt tgacttcccc gagggcaaga acgcatctgt gcgcacggtg 
1301 aatatcggct ccacaaaggg gtcctgtctg gataagcggg actgcgagaa 
1351 ctacatcact ctcctggaga ggcggagtga ggggctgctg gcctgtggca 
1401 ccaacgcccg gcaccccagc tgctggaacc tggtgaatgg cactgtggtg 
1451 ccacttggcg agatgagagg ctacgccccc ttcagcccgg acgagaactc 
1501 cctggttctg tttgaagggg acgaggtgta ttccaccatc cggaagcagg 
1551 aatacaatgg gaagatccct cggttccgcc gcatccgggg cgagagtgag 
1601 ctgtacacca gtgatactgt catgcagaac ccacagttca tcaaagccac 
1651 catcgtgcac caagaccagg cttacgatga caagatctac tacttcttcc 
1701 gagaggacaa tcctgacaag aatcctgagg ctcctctcaa tgtgtcccgt 
1751 gtggcccagt tgtgcagggg ggaccagggt ggggaaagtt cactgtcagt 
1801 ctccaagtgg aacacttttc tgaaagccat gctggtatgc agtgatgctg 
1851 ccaccaacaa gaacttcaac aggctgcaag acgtcttcct gctccctgac 
1901 cccagcggcc agtggaggga caccagggtc tatggtgttt tctccaaccc 
1951 ctggaactac tcagccgtct gtgtgtattc cctcggtgac attgacaagg 
2001 tcttccgtac ctcctcactc aagggctacc actcaagcct tcccaacccg 
2051 cggcctggca agtgcctccc agaccagcag ccgataccca cagagacctt 
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2101 ccaggtggct gaccgtcacc cagaggtggc gcagagggtg gagcccatgg 
2151 ggcctctgaa gacgccattg ttccactcta aataccacta ccagaaagtg 
2201 gccgttcacc gcatgcaagc cagccacggg gagacctttc atgtgcttta 
2251 cctaactaca gacaggggca ctatccacaa ggtggtggaa ccgggggagc 
2301 aggagcacag cttcgccttc aacatcatgg agatccagcc cttccgccgc 
2351 gcggctgcca tccagaccat gtcgctggat gctgagcgga ggaagctgta 
2401 tgtgagctcc cagtgggagg tgagccaggt gcccctggac ctgtgtgagg 
2451 tctatggcgg gggctgccac ggttgcctca tgtcccgaga cccctactgc 
2501 ggctgggacc agggccgctg catctccatc tacagctccg aacggtcagt 
2551 gctgcaatcc attaatccag ccgagccaca caaggagtgt cccaacccca 
2601 aaccagacaa ggccccactg cagaaggttt ccctggcccc aaactctcgc 
2 651 tactacctga gctgccccat ggaatcccgc cacgccacct actcatggcg 
2701 ccacaaggag aacgtggagc agagctgcga acctggtcac cagagcccca 
2751 actgcatcct gttcatcgag aacctcacgg cgcagcagta cggccactac 
2801 ttctgcgagg cccaggaggg ctcctacttc cgcgaggctc agcactggca 
2 851 gctgctgccc gaggacggca tcatggccga gcacctgctg ggtcatgcct 
2901 gtgccctggc tgcctccctc tggctggggg tgctgcccac actcactctt 

2 951 ggcttgctgg tccacgtgaa gcttGGGCCC GAACAAAAAC TCATCTCAGA 
3001 AGAGGATCTG AATAGCGCCG TCGACCATCA TCATCATCAT CATTGAGTTT 
3051 AAACCGCTGA TCAGCCTCGA CTGTGCCTTC TAGTTGCCAG CCATCTGTTG 
3101 TTTGCCCCTC CCCCGTGCCT TCCTTGACCC TGGAAGGTGC CACTCCCACT 
3151 GTCCTTTCCT AATAAAATGA GGAAATTGCA TCGCATTGTC TGAGTAGGTG 
3201 TCATTCTATT CTGGGGGGTG GGGTGGGGCA GGACAGCAAG GGGGAGGATT 
3251 GGGAAGACAA TAGCAGGCAT GCTGGGGATG CGGTGGGCTC TATGGCTTCT 
3301 GAGGCGGAAA GAACCAGCTG GGGCTCTAGG GGGTATCCCC ACGCGCCCTG 
3351 TAGCGGCGCA TTAAGCGCGG CGGGTGTGGT GGTTACGCGC AGCGTGACCG 
3401 CTACACTTGC CAGCGCCCTA GCGCCCGCTC CTTTCGCTTT CTTCCCTTCC 
34 51 TTTCTCGCCA CGTTCGCCGG CTTTCCCCGT CAAGCTCTAA ATCGGGGCAT 
3501 CCCTTTAGGG TTCCGATTTA GTGCTTTACG GCACCTCGAC CCCAAAAAAC 
3551 TTGATTAGGG TGATGGTTCA CGTAGTGGGC CATCGCCCTG ATAGAGGGTT 

3 601 TTTCGCCCTT TGACGTTGGA GTCCACGTTC TTTAATAGTG GACTCTTGTT 
3 651 CCAAACTGGA ACAACACTCA ACCCTATCTC GGTCTATTCT TTTGATTTAT 
37 01 AAGGGATTTT GGGGATTTCG GCCTATTGGT TAAAAAATGA GCTGATTTAA 
3751 CAAAAATTTA ACGCGAATTA ATTCTGTGGA ATGTGTGTCA GTTAGGGTGT 
3801 GGAAAGTCCC CAGGCTCCCC AGGCAGGCAG AAGTATGCAA AGCATGCATC 
3 851 TCAATTAGTC AGCAACCAGG TGTGGAAAGT CCCCAGGCTC CCCAGCAGGC 
3 901 AGAAGTATGC AAAGCATGCA TCTCAATTAG TCAGCAACCA TAGTCCCGCC 
3951 CCTAACTCCG CCCATCCCGC CCCTAACTCC GCCCAGTTCC GCCCATTCTC 
4001 CGCCCCATGG CTGACTAATT TTTTTTATTT ATGCAGAGGC CGAGGCCGCC 
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4051 


TCTGCCTCTG 


AGCTATTCCA 


GAAGTAGTGA 


GGAGGCTTTT 


TTGGAGGCCT 




4101 


AGGCTTTTGC 


AAAAAGCTCC 


CGGGAGCTTG 


TATATCCATT 


TTCGGATCTG 


5 


4151 


ATCAAGAGAC 


AGGATGAGGA 


TCGTTTCGCA 


TGATTGAACA 


AGATGGATTG 




4201 


CACGCAGGTT 


CTCCGGCCGC 


TTGGGTGGAG 


AGGCTATTCG 


GCTATGACTG 




4251 


GGCACAACAG 


ACAATCGGCT 


GCTCTGATGC 


CGCCGTGTTC 


CGGCTGTCAG 




4301 


CGCAGGGGCG 


CCCGGTTCTT 


TTTGTCAAGA 


CCGACCTGTC 


CGGTGCCCTG 


10 


4351. 


AATGAACTGC 


AGGACGAGGC 


AGCGCGGCTA 


TCGTGGCTGG 


CCACGACGGG 




4401 


CGTTCCTTGC 


GCAGCTGTGC 


TCGACGTTGT 


CACTGAAGCG 


GGAAGGGACT 




4451 


GGCTGCTATT 


GGGCGAAGTG 


CCGGGGCAGG 


ATCTCCTGTC 


ATCTCACCTT 




4501 


GCTCCTGCCG 


AGAAAGTATC 


CATCATGGCT 


GATGCAATGC 


GGCGGCTGCA 


15 


4551 


TACGCTTGAT 


CCGGCTACCT 


GCCCATTCGA 


CCACCAAGCG 


AAACATCGCA 




4601 


TCGAGCGAGC 


ACGTACTCGG 


ATGGAAGCCG 


GTCTTGTCGA 


TCAGGATGAT 




4651 


CTGGACGAAG 


AGCATCAGGG 


GCTCGCGCCA 


GCCGAACTGT 


TCGCCAGGCT 


20 


4701 


CAAGGCGC GC 


ATGCCCGACG 


gcgaggatct' 


CGTCGTGACC 


CATGGCGATG 


4751 


CCTGCTTGCC 


GAATATCATG 


GTGGAAAATG 


GCCGCTTTTC 


TGGATTCATC 




4 8 G 1 


GACTGTGGCC 


GGCTGGGTGT 


GGCGGACCGC 


TATCAGGACA 


TAGCGTTGGC 




4851 


TACCCGTGAT 


ATTGCTGAAG 


AGCTTGGCGG 


CGAATGGGCT 


GACCGCTTCC 


25 


4901 


TCGTGCTTTA 


CGGTATCGCC 


GCTCCCGATT 


CGCAGCGCAT 


CGCCTTCTAT 




4951 


CGCCTTCTTG 


ACGAGTTCTT 


CTGAGCGGGA 


CTCTGGGGTT 


CGAAATGACC 




5001 


GACCAAGCGA 


CGCCCAACCT 


GCCATCACGA 


GATTTCGATT 


CCACCGCCGC 




5051 


CTTCTATGAA 


AGGTTGGGCT 


TCGGAATCGT 


TTTCCGGGAC 


GCCGGCTGGA 


30 


5101 


TGATCCTCCA 


GCGCGGGGAT 


CTCATGCTGG 


AGTTCTTCGC 


CCACCCCAAC 




5151 


TTGTTTATTG 


CAGCTTATAA 


TGGTTACAAA 


TAAAGCAATA 


GCATCACAAA 




5201 


TTTCACAAAT 


AAAGCATTTT 


TTTCACTGCA 


TTCTAGTTGT 


GGTTTGTCCA 




5251 


AACTCATCAA 


TGTATCTTAT 


CATGTCTGTA 


TACCGTCGAC 


CTCTAGCTAG 


35 


5301 


AGCTTGGCGT 


AATCATGGTC 


ATAGCTGTTT 


CCTGTGTGAA 


ATTGTTATCC 




5351 


GCTCACAATT 


CCACACAACA 


TACGAGCCGG 


AAGCATAAAG 


TGTAAAGCCT 




5401 


GGGGTGCCTA 


ATGAGTGAGC 


TAACTCACAT 


TAATTGCGTT 


GCGCTCACTr; 


40 


5451 


CCCGCTTTCC 


AGTCGGGAAA 


CCTGTCGTGC 


CAGCTGCATT 


AATGAATCGG 


5501 


CCAACGCGCG 


GGGAGAGGCG 


GTTTGCGTAT 


TGGGCGCTCT 


TCCGCTTCCT 




5551 


CGCTCACTGA 


CTCGCTGCGC 


TCGGTCGTTC 


GGCTGCGGCG 


AGCGGTATCA 




5 601 


GCTCACTCAA 


AGGCGGTAAT 


ACGGTTATCC 


ACAGAATCAG 


GGGATAACGC 


45 


5651 


AGGAAAGAAC 


ATGTGAGCAA 


AAGGCCAGCA 


AAAGGCCAGG 


AACCGTAAAA 


5701 


AGGCCGCGTT 


GCTGGCGTTT 


TTCCATAGGC 


TCCGCCCCCC 


TGACGAGCAT 




5751 


CACAAAAATC 


GACGCTCAAG 


TCAGAGGTGG 


CGAAACCCGA 


CAGGACTATA 




5801 


AAGATACCAG 


GCGTTTCCCC 


CTGGAAGCTr 






50 


5851 


CGACCCTGCC 


GCTTACCGGA 


TACCTGTCCG 


CCTTTCTCCC 


TTCGGGAAGC 




5 901 


GTGGCGCTTT 


CTCAATGCTC 


ACGCTGTAGG 


TATCTCAGTT 


CGGTGTAGGT 




5951 


CGTTCGCTCC 


AAGCTGGGCT 


GTGTGCACGA 


ACCCCCCGTT 


CAGCCCGACC 
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5 



10 



20 



25 



30 



35 



6001 


GCTGCGCCTT 


ATCCGGTAAC 


TATCGTCTTG 


AGTCCAACCC 


GGTAAGACAC 


6051 


GACTTATCGC 


CACTGGCAGC 


AGCCACTGGT 


AACAGGATTA 


GCAGAGCGAG 


6101 


GTATGTAGGC 


GGTGCTACAG 


AGTTCTTGAA 


GTGGTGGCCT 


AACTACGGCT 


6151 


ACACTAGAAG 


GACAGTATTT 


GGTATCTGCG 


CTCTGCTGAA 


GCCAGTTACC 


6201 


TTCGGAAAAA 


GAGTTGGTAG 


CTCTTGATCC 


GGCAAACAAA 


CCACCGCTGG 


6251 


TAGCGGTGGT 


TTTTTTGTTT 


GCAAGCAGCA 


GATTACGCGC 


AGAAAAAAAG 


6301 


GATCTCAAGA 


AGATCCTTTG 


ATCTTTTCTA 


CGGGGTCTGA 


CGCTCAGTGG 


6351 


AACGAAAACT 


CACGTTAAGG 


GATTTTGGTC 


ATGAGATTAT 


CAAAAAGGAT 


6401 


CTTCACCTAG 


ATCCTTTTAA 


ATTAAAAATG 


AAGTTTTAAA 


TCAATCTAAA 


6451 


GTATATATGA 


GTAAACTTGG 


TCTGACAGTT 


ACCAATGCTT 


AATCAGTGAG 


6501 


GCACCTATCT 


CAGCGATCTG 


TCTATTTCGT 


TCATCCATAG 


TTGCCTGACT 


6551 


CCCCGTCGTG 


TAGATAACTA 


CGATACGGGA 


GGGCTTACCA 


TCTGGCCCCA 


6601 


GTGCTGCAAT 


GATACCGCGA 


GACCCACGCT 


CACCGGCTCC 


AGATTTATCA 


6651 


GCAATAAACC 


AGCCAGCCGG 


AAGGGCCGAG 


CGCAGAAGTG 


GTCCTGCAAC 


6701 


TTTATCCGCC 


TCCATCCAGT 


CTATTAATTG 


TTGCCGGGAA 


GCTAGAGTAA 


6751 


GTAGTTCGCC 


AGTTAATAGT 


TTGCGCAACG 


TTGTTGCCAT 


TGCTACAGGC 


6801 


ATCGTGGTGT 


CACGCTCGTC 


GTTTGGTATG 


GCTTCATTCA 


GCTCCGGTTC 


6851 


CCAACGATCA 


AGGCGAGTTA 


CATGATCCCC 


CATGTTGTGC 


AAAAAAGCGG 


6901 


TTAGCTCCTT 


CGGTCCTCCG 


ATCGTTGTCA 


GAAGTAAGTT 


GGCCGCAGTG 


6951 


TTATCACTCA 


TGGTTATGGC 


AGCACTGCAT 


AATTCTCTTA 


CTGTCATGCC 


7001 


ATCCGTAAGA 


TGCTTTTCTG 


TGACTGGTGA 


GTACTCAACC 


AAGTCATTCT 


7051 


GAGAATAGTG 


TATGCGGCGA 


CCGAGTTGCT 


CTTGCCCGGC 


GTCAATACGG 


7101 


GATAATACCG 


CGCCACATAG 


CAGAACTTTA 


AAAGTGCTCA 


TCATTGGAAA 


7151 


ACGTTCTTCG 


GGGCGAAAAC 


TCTCAAGGAT 


CTTACCGCTG 


TTGAGATCCA 


7201 


GTTCGATGTA 


ACCCACTCGT 


GCACCCAACT 


GATCTTCAGC 


ATCTTTTACT 


7251 


TTCACCAGCG 


TTTCTGGGTG 


AGCAAAAACA 


GGAAGGCAAA 


ATGCCGCAAA 


7301 


AAAGGGAATA 


AGGGCGACAC 


GGAAATGTTG 


AATACTCATA 


CTCTTCCTTT 


7351 


TTCAATATTA 


TTGAAGCATT 


TATCAGGGTT 


ATTGTCTCAT 


GAGCGGATAC 


7401 


ATATTTGAAT 


GTATTTAGAA 


AAATAAACAA 


ATAGGGGTTC 


CGCGCACATT 


7451 


TCCCCGAAAA 


GTGCCACCTG 


ACGTC 







Tabelle 9: Nukleotidsequenz des rekombinanlen Plasmids pcONA 3. 1 -H-SemaL-EGFR-MychisA 
(SEQIDNO.:36) 

1 GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC 
51 TGCTCTGATG CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT . 
101 GGAGGTCGCT GAGTAGTGCG CGAGCAAAAT TTAAGCTACA ACAAGGCAAG 
151 GCTTGACCGA CAATTGCATG AAGAATCTGC TTAGGGTTAG GCGTTTTGCG 
201 CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT GATTATTGAC 



55 



EP 0 892 047 A2 





251 


TAGTTATTAA 


TAGTAATCAA 




301 


TGGAGTTCCG 


CGTTACATAA 


c 
0 


351 


CCCAACGACC 


CCCGCCCATT 




401 


AACGCCAATA 


GGGACTTTCr 




451 


AAACTGCCCA 


CTTGGCAGTA 




501 


CCTATTGACG 


TCAATGACGG 


10 


551 


CATGACCTTA 


TGGGACTTTC 




601 


TCGCTATTAC 


CATGGTGATG 




651 


TAGCGGTTTG 


ACTCACGGGG 




701 


TGGGAGTTTG 


TTTTGGCACC 


15 


751 


ACAACTCCGC 


CCCATTGACG 




801 


GTCTATATAA 


GCAGAGCTCT 




851 


GCTTATCGAA 


ATTAATACGA 


20 


901 


GTTTAAACGG 


GCCCTCTAGA 


951 


GCAgaattcg 


gcttgggatg 




1001 


agcgcaccgc 


gcgcccgcgt 




1051 


gctgcggctg 


cggctgctgc 


25 


1101 


agggccacct 


aaggagcgga 




1151 


gtagggcagg 


accgggtgga 




1201 


tttccacgag 


ccaggcagct 




1251 


tctacctctt 


tgacttcccc 


30 


1301 


aatatcggct 


ccacaaaggg 




1351 


ctacatcact 


ctcctggaga 




1401 


ccaacgcccg 


gcaccccagc 




1451 


ccacttggcg 


aaa taaaaoG 


35 


1501 


cctggttctg 






1551 


aatacaatgg 


gaagatccct 




1601 


ctgtacacca 


gtgatactgt 




1651 


catcgtgcac 


caagaccagg 


40 


1701 


gagaggacaa 


tcctgacaag 




1751 


gtggcccagt 


tgtgcagggg 




1801 


ctccaagtgg 


aacacttttc 


45 


1851 


ccaccaacaa 


gaacttcaac 


1901 


cccagcggcc 


aqtaaaaaaa 




1951 


ctggaactac 


tcagccgtct 




2001 


tcttccotAr' 




50 


2051 


cggcctggca 


agtgcctccc 


2101 


ccaggtggct 


gaccgtcacc 




2151 


ggcctctgaa 


gacgccattg 



TTACGGGGTC ATTAGTTCAT AGCCCATATA 
CTTACGGTAA ATGGCCCGCC TGGCTGACCG 
GACGTCAATA ATGACGTATG TTCCCATAGT 
ATTGACGTCA ATGGGTGGAC TATTTACGGT 
CATCAAGTGT ATCATATGCC AAGTACGCCC 
TAAATGGCCC GCCTGGCATT ATGCCCAGTA 
CTACTTGGCA GTACATCTAC GTATTAGTCA 
CGGTTTTGGC AGTACATCAA TGGGCGTGGA 
ATTTCCAAGT CTCCACCCCA TTGACGTCAA 
AAAATCAACG GGACTTTCCA AAATGTCGTA 
CAAATGGGCG GTAGGCGTGT ACGGTGGGAG 
CTGGCTAACT AGAGAACCCA CTGCTTACTG 
CTCACTATAG GGAGACCCAA GCTGGCTAGC 
CTCGAGCGGC CGCCACTGTG CTGGATATCT 
acgcctcctc cgcccggacg tgccgccccc 
ccctggcccg ccggctcggt tggggcttcc 
tgctgctctg ggcggccgcc gcctccgccc 
ccccgcatct tcgccgtctg gaaaggccat 
ctttggccag actgagccgc acacggtgct 
cctctgtgtg ggtgggagga cgtggcaagg 
gagggcaaga acgcatctgt gcgcacggtg 
gtcctgtctg gataagcggg actgcgagaa 
ggcggagtga ggggctgctg gcctgtggca 
tgctggaacc tggtgaatgg cactgtggtg 
ctacgccccc ttcagcccgg acgagaactc 
acgaggtgta ttccaccatc cggaagcagg 
cggttccgcc gcatccgggg cgagagtgag 
catgcagaac ccacagttca tcaaagccac 
cttacgatga caagatctac tacttcttcc 
aatcctgagg ctcctctcaa tgtgtcccgt 
ggaccagggt ggggaaagtt cactgtcagt 
tgaaagccat gctggtatgc agtgatgctg 
aggctgcaag acgtcttcct gctccctgac 
caccagggtc tatggtgttt tctccaaccc 
gtgtgtattc cctcggtgac attgacaagg 
aagggctacc actcaagcct tcccaacccg 
agaccagcag ccgataccca cagagacctt 
cagaggtggc gcagagggtg gagcccatgg 
ttccactcta aataccacta ccagaaagtg 
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2201 gccgttcacc gcatgcaagc cagccacggg gagacctttc atgtgcttta 
2251 cctaactaca gacaggggca ctatccacaa ggtggtggaa ccgggggagc 
2301 aggagcacag cttcgccttc aacatcatgg agatccagcc cttccgccgc 
2351 gcggctgcca tccagaccat gtcgctggat gctgagcgga ggaagctgta 
2401 tgtgagctcc cagtgggagg tgagccaggt gcccctggac ctgtgtgagg 
2451 tctatggcgg gggctgccac ggttgcctca tgtcccgaga cccctactgc 
2501 ggctgggacc agggccgctg catctccatc tacagctccg aacggtcagt 
2551 gctgcaatcc attaatccag ccgagccaca caaggagtgt cccaacccca 
2601 aaccagacaa ggccccactg cagaaggttt ccctggcccc aaactctcgc 
2651 tactacctga gctgccccat ggaatcccgc cacgccacct actcatggcg 
2701 ccacaaggag aacgtggagc agagctgcga acctggtcac cagagcccca 
2751 actgcatcct gttcatcgag aacctcacgg cgcagcagta cggccactac 
2801 ttctgcgagg cccaggaggg ctcctacttc cgcgaggctc agcactggca 
2851 gctgctgccc gaggacggca tcatggccga gcacctgctg ggtcatgcct 
2901 gtgccctggc tgcctccctc tggctggggg tgctgcccac actcactctt 

2 951 ggcttgctgg tccacATGGT GAGCAAGGGC GAGGAGCTGT TCACCGGGGT 
3001 GGTGCCCATC CTGGTCGAGC TGGACGGCGA CGTAAACGGC CACAAGTTCA 
3051 GCGTGTCCGG CGAGGGCGAG GGCGATGCCA CCTACGGCAA GCTGACCCTG 
3101 AAGTTCATCT GCACCACCGG CAAGCTGCCC GTGCCCTGGC CCACCCTCGT 
3151 GACCACCCTG ACCTACGGCG TGCAGTGCTT CAGCCGCTAC CCCGACCACA 
3201 TGAAGCAGCA CGACTTCTTC AAGTCCGCCA TGCCCGAAGG CTACGTCCAG 
32 51 GAGCGCACCA TCTTCTTCAA GGACGACGGC AACTACAAGA CCCGCGCCGA 

3 301 GGTGAAGTTC GAGGGCGACA CCCTGGTGAA CCGCATCGAG CTGAAGGGCA 
3351 TCGACTTCAA GGAGGACGGC AACATCCTGG GGCACAAGCT GGAGTACAAC 
3 401 TACAACAGCC ACAACGTCTA TATCATGGCC GACAAGCAGA AGAACGGCAT 
3451 CAAGGTGAAC TTCAAGATCC GCCACAACAT GGAGGACGGC AGCGTGCAGC 
3 501 TCGCCGACCA CTACCAGCAG AACACCCCCA TCGGCGACGG CCCCGTGCTG 
3551 CTGCCCGACA ACCACTACCT GAGCACCCAG TCCGCCCTGA GCAAAGACCC 
3 601 CAACGAGAAG CGCGATCACA TGGTCCTGCT GGAGTTCGTG ACCGCCGCCG 
3 651 GGATCACTCT CGGCATGGAC GAGCTGTACA Aggtgaagct tGGGCCCGAA 
3701 CAAAAACTCA TCTCAGAAGA GGATCTGAAT AGCGCCGTCG ACCATCATCA 
37 51 TCATCATCAT TGAGTTTAAA CCGCTGATCA GCCTCGACTG TGCCTTCTAG 
3801 TTGCCAGCCA TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC TTGACCCTGG 
3851 AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAATGAGGA AATTGCATCG 
3 901 CATTGTCTGA GTAGGTGTCA TTCTATTCTG GGGGGTGGGG TGGGGCAGGA 
3951 CAGCAAGGGG GAGGATTGGG AAGACAATAG CAGGCATGCT GGGGATGCGG 
4001 TGGGCTCTAT GGCTTCTGAG GCGGAAAGAA CCAGCTGGGG CTCTAGGGGG 
4051 TATCCCCACG CGCCCTGTAG CGGCGCATTA AGCGCGGCGG GTGTGGTGGT 
4101 TACGCGCAGC GTGACCGCTA CACTTGCCAG CGCCCTAGCG CCCGCTCCTT 



EP 0 892 047 A2 



4151 TCGCTTTCTT CCCTTCCTTT CTCGCCACGT TCGCCGGCTT TCCCCGTCAA 
4201 GCTCTAAATC GGGGCATCCC TTTAGGGTTC CGATTTAGTG CTTTACGGCA 
4251 CCTCGACCCC AAAAAACTTG ATTAGGGTGA TGGTTCACGT AGTGGGCCAT 
4 301 CGCCCTGATA GACGGTTTTT CGCCCTTTGA CGTTGGAGTC CACGTTCTTT 
4351 AATAGTGGAC TCTTGTTCCA AACTGGAACA ACACTCAACC CTATCTCGGT 
4 4 01 CTATTCTTTT GATTTATAAG GGATTTTGGG GATTTCGGCC TATTGGTTAA 
4 4 51 AAAATGAGCT GATTTAACAA AAATTTAACG CGAATTAATT CTGTGGAATG 
4 501 TGTGTCAGTT AGGGTGTGGA AAGTCCCCAG GCTCCCCAGG CAGGCAGAAG 
45 51 TATGCAAAGC ATGCATCTCA ATTAGTCAGC AACCAGGTGT GGAAAGTCCC 
4 601 CAGGCTCCCC AGCAGGCAGA AGTATGCAAA GCATGCATCT CAATTAGTCA 
4 651 GCAACCATAG TCCCGCCCCT AACTCCGCCC ATCCCGCCCC TAACTCCGCC 
47 01 CAGTTCCGCC CATTCTCCGC CCCATGGCTG ACTAATTTTT TTTATTTATG 
47 51 CAGAGGCCGA GGCCGCCTCT GCCTCTGAGC TATTCCAGAA GTAGTGAGGA 
4 801 GGCTTTTTTG GAGGCCTAGG CTTTTGCAAA AAGCTCCCGG GAGCTTGTAT 
4851 ATCCATTTTC GGATCTGATC AAGAGACAGG ATGAGGATCG TTTCGCATGA 
4 901 ttg;^acaaga TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG 

4 951 CTATTCGGCT ATGACTGGGC ACAACAGACA ATCGGCTGCT CTGATGCCGC 
5001 CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG 
5051 ACCTGTCCGG TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG 
5101 TGGCTGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC 
5151 TGAAGCGGGA AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC 
5201 TCCTGTCATC TCACCTTGCT CCTGCCGAGA AAGTATCCAT CATGGCTGAT 
5251 GCAATGCGGC GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA 

5 301 CCAAGCGAAA CATCGCATCG AGCGAGCACG TACTCGGATG GAAGCCGGTC 
5351 TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC 
5 401 GAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT 
5451 CGTGACCCAT GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC 
5501 GCTTTTCTGG ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT 
5551 CAGGACATAG CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA 
5 601 ATGGGCTGAC CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC 
5 651 AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGCGGGACTC 
5701 TGGGGTTCGA AATGACCGAC CAAGCGACGC CCAACCTGCC ATCACGAGAT 
5751 TTCGA-TTCCA CCGCCGCCTT CTATGAAAGG TTGGGCTTCG GAATCGTTTT 
5801 CCGGGACGCC GGCTGGATGA TCCTCCAGCG CGGGGATCTC ATGCTGGAGT 
5851 TCTTCGCCCA CCCCAACTTG TTTATTGCAG CTTATAATGG TTACAAATAA 
5901 AGCAATAGCA TCACAAATTT CACAAATAAA GCATTTTTTT CACTGCATTC 
5 951 TAGTTGTGGT TTGTCCAAAC TCATCAATGT ATCTTATCAT GTCTGTATAC 
6001 CGTCGACCTC TAGCTAGAGC TTGGCGTAAT CATGGTCATA GCTGTTTCCT 
6051 GTGTGAAATT GTTATCCGCT CACAATTCCA CACAACATAC GAGCCGGAAG 
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6101 CATAAAGTGT AAAGCCTGGG GTGCCTAATG AGTGAGCTAA CTCACATTAA 
6151 TTGCGTTGCG CTCACTGCCC GCTTTCCAGT CGGGAAACCT GTCGTGCCAG 
6201 CTGCATTAAT GAATCGGCCA ACGCGCGGGG AGAGGCGGTT TGCGTATTGG 
62 51 GCGCTCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTCG GTCGTTCGGC 
6301 TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATACG GTTATCCACA 
6351 GAATCAGGGG ATAACGCAGG AAAGAACATG TGAGCAAAAG GCCAGCAAAA 
64 01 GGCCAGGAAC CGTAAAAAGG CCGCGTTGCT GGCGTTTTTC CATAGGCTCC 
64 51 GCCCCCCTGA CGAGCATCAC AAAAATCGAC GCTCAAGTCA GAGGTGGCGA 
6501 AACCCGACAG GACTATAAAG ATACCAGGCG TTTCCCCCTG GAAGCTCCCT 
6551 CGTGCGCTCT CCTGTTCCGA CCCTGCCGCT TACCGGATAC CTGTCCGCCT 
6601 TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC AATGCTCACG CTGTAGGTAT 
6651 CTCAGTTCGG TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG TGCACGAACC 
6701 CCCCGTTCAG CCCGACCGCT GCGCCTTATC CGGTAACTAT CGTCTTGAGT 
6751 CCAACCCGGT AAGACACGAC TTATCGCCAC TGGCAGCAGC CACTGGTAAC 
68 01 AGGATTAGCA GAGCGAGGTA TGTAGGCGGT GCTACAGAGT TCTTGAAGTG 
68 51 GTGGCCTAAC TACGGCTACA CTAGAAGGAC AGTATTTGGT ATCTGCGCTC 
6901 TGCTGAAGCC AGTTACCTTC GGAAAAAGAG TTGGTAGCTC TTGATCCGGC 
6951 AAACAAACCA CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA AGCAGCAGAT 
7001 TACGCGCAGA AAAAAAGGAT CTCAAGAAGA TCCTTTGATC TTTTCTACGG 
7051 GGTCTGACGC TCAGTGGAAC GAAAACTCAC GTTAAGGGAT TTTGGTCATG 
7101 AGATTATCAA AAAGGATCTT CACCTAGATC CTTTTAAATT AAAAATGAAG 
7151 TTTTAAATCA ATCTAAAGTA TATATGAGTA AACTTGGTCT GACAGTTACC 
7201 AATGCTTAAT CAGTGAGGCA CCTATCTCAG CGATCTGTCT ATTTCGTTCA 
7 251 TCCATAGTTG CCTGACTCCC CGTCGTGTAG ATAACTACGA TACGGGAGGG 
7301 CTTACCATCT GGCCCCAGTG CTGCAATGAT ACCGCGAGAC CCACGCTCAC 
7 351 CGGCTCCAGA TTTATCAGCA ATAAACCAGC CAGCCGGAAG GGCCGAGCGC 
7 401 AGAAGTGGTC CTGCAACTTT ATCCGCCTCC ATCCAGTCTA TTAATTGTTG 
7 451 CCGGGAAGCT AGAGTAAGTA GTTCGCCAGT TAATAGTTTG CGCAACGTTG 
7 501 TTGCCATTGC TACAGGCATC GTGGTGTCAC GCTCGTCGTT TGGTATGGCT 
7 551 TCATTCAGCT CCGGTTCCCA ACGATCAAGG CGAGTTACAT GATCCCCCAT 
7 601 GTTGTGCAAA AAAGCGGTTA GCTCCTTCGG TCCTCCGATC GTTGTCAGAA 
7 651 GTAAGTTGGC CGCAGTGTTA TCACTCATGG TTATGGCAGC ACTGCATAAT 
77 01 TCTCTTACTG TCATGCCATC CGTAAGATGC TTTTCTGTGA CTGGTGAGTA 
77 51 CTCAACCAAG TCATTCTGAG AATAGTGTAT GCGGCGACCG AGTTGCTCTT 
7 801 GCCCGGCGTC AATACGGGAT AATACCGCGC CACATAGCAG AACTTTAAAA 
7 851 GTGCTCATCA TTGGAAAACG TTCTTCGGGG CGAAAACTCT CAAGGATCTT 
7 901 ACCGCTGTTG AGATCCAGTT CGATGTAACC CACTCGTGCA CCCAACTGAT 
7 951 CTTCAGCATC TTTTACTTTC ACCAGCGTTT CTGGGTGAGC AAAAACAGGA 
8001 AGGCAAAATG CCGCAAAAAA GGGAATAAGG GCGACACGGA AATGTTGAAT 
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8051 ACTCATACTC TTCCTTTTTC AATATTATTG AAGCATTTAT CAGGGTTATT 
8101 GTCTCATGAG CGGATACATA TTTGAATGTA TTTAGAAAAA TAAACAAATA 
8151 GGGGTTCCGC GCACATTTCC CCGAAAAGTG CCACCTGACG TC 



10 



15 



30 



35 



40 



45 



50 



Tabelle 1 0: Nukleotidsequenz des rekombinanten Rasmids pIND-H-SemaL-EE (SEQ !D NO.: 37) 



1 AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT 
51 TGTTCTCGTT AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC 
101 GATGGACAAG TGCATTGTTC TCTTGCTGAA AGCTCGATGG ACAAGTGCAT 
151 TGTTCTCTTG CTGAAAGCTC AGTACCCGGG AGTACCCTCG ACCGCCGGAG 
201 TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT TCAAACAAGC 

2 51 AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 
20 GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA 

3 51 AAAGTAACCA GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA 

4 01 GAAGTAATTA TTGAATACAA GAAGAGAACT CTGAATACTT TCAACAAGTT 
451 ACCGAGAAAG AAGAACTCAC ACACAGCTAG CGTTTAAACT TAAGCTTGGT 

25 501 ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGgaattcgg cttgggatga 

551 cgcctcctcc gcccggacgt gccgccccca gcgcaccgcg cgcccgcgtc 
601 cctggcccgc cggctcggtt ggggcttccg ctgcggctgc ggctgctgct 
651 gctgctctgg gcggccgccg cctccgccca gggccaccta aggagcggac 
701 cccgcatctt cgccgtctgg aaaggccatg tagggcagga ccgggtggac 
751 tttggccaga ctgagccgca cacggtgctt ttccacgagc caggcagctc 
801 ctctgtgtgg gtgggaggac gtggcaaggt ctacctcttt gacttccccg 
851 agggcaagaa cgcatctgtg cgcacggtga atatcggctc cacaaagggg 
901 tcctgtctgg ataagcggga ctgcgagaac tacatcactc tcctggagag 
951 gcggagtgag gggctgctgg cctgtggcac caacgcccgg caccccagct 
1001 gctggaacct ggtgaatggc actgtggtgc cacttggcga gatgagaggc 
1051 tacgccccct tcagcccgga cgagaactcc ctggttctgt ttgaagggga 
1101 cgaggtgtat tccaccatcc ggaagcagga atacaatggg aagatccctc 
1151 ggttccgccg catccggggc gagagtgagc tgtacaccag tgatactgtc 
1201 atgcagaacc cacagttcat caaagccacc atcgtgcacc aagaccaggc 
1251 ttacgatgac aagatctact acttcttccg agaggacaat cctgacaaga 
1301 atcctgaggc tcctctcaat gtgtcccgtg tggcccagtt gtgcaggggg 
1351 g.accagggtg gggaaagttc actgtcagtc tccaagtgga acacttttct 
1401 gaaagccatg ctggtatgca gtgatgctgc caccaacaag aacttcaaca 
1451 ggctgcaaga cgtcttcctg ctccctgacc ccagcggcca gtggagggac 
1501 accagggtct atggtgtttt ctccaacccc tggaactact cagccgtctg 
1551 tgtgtattcc ctcggtgaca ttgacaaggt cttccgtacc tcctcactca 
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1601 agggctacca ctcaagcctt cccaacccgc ggcctggcaa gtgcctccca 
1651 gaccagcagc cgatacccac agagaccttc caggtggctg accgtcaccc 
1701 agaggtggcg cagagggtgg agcccatggg gcctctgaag acgccattgt 
1751 tccactctaa ataccactac cagaaagtgg ccgttcaccg catgcaagcc 
1801 agccacgggg agacctttca tgtgctttac ctaactacag acaggggcac 
1851 tatccacaag gtggtggaac cgggggagca ggagcacagc ttcgccttca 
1901 acatcatgga gatccagccc ttccgccgcg cggctgccat ccagaccatg 
1951 tcgctggatg ctgagcggag gaagctgtat gtgagctccc agtgggaggt 
2001 gagccaggtg cccctggacc tgtgtgaggt ctatggcggg ggctgccacg 
2051 gttgcctcat gtcccgagac ccctactgcg gctgggacca gggccgctgc 
2101 atctccatct acagctccga acggtcagtg ctgcaatcca ttaatccagc 
2151 cgagccacac aaggagtgtc ccaaccccaa accagacaag gccccactgc 
2201 agaaggtttc cctggcccca aactctcgct actacctgag ctgccccatg 
2251 gaatcccgcc acgccaccta ctcatggcgc cacaaggaga acgtggagca 
2301 gagctgcgaa cctggtcacc agagccccaa ctgcatcctg ttcatcgaga 
2 351 acctcacggc gcagcagtac ggccactact tctgcgaggc ccaggagggc 
2401 tcctacttcc gcgaggctca gcactggcag ctgctgcccg aggacggcat 
2451 catggccgag cacctgctgg gtcatgcctg tgccctggct gcctccctct 
2501 ggctgggggt gctgcccaca ctcactcttg gcttgctggt ccacgtgaag 
2551 cttGGGCCCG TTTAAACCCG CTGATCAGCC TCGACTGTGC CTTCTAGTTG 
2 601 CCAGCCATCT GTTGTTTGCC CCTCCCCCGT GCCTTCCTTG ACCCTGGAAG 
2 651 GTGCCACTCC CACTGTCCTT TCCTAATAAA ATGAGGAAAT TGCATCGCAT 
27 01 TGTCTGAGTA GGTGTCATTC TATTCTGGGG GGTGGGGTGG GGCAGGACAG 
27 51 CAAGGGGGAG GATTGGGAAG ACAATAGCAG GCATGCTGGG GATGCGGTGG 
2 801 GCTCTATGGC TTCTGAGGCG GAAAGAACCA GCTGGGGCTC TAGGGGGTAT 
2 851 CCCCACGCGC CCTGTAGCGG CGCATTAAGC GCGGCGGGTG TGGTGGTTAC 
2 901 GCGCAGCGTG ACCGCTACAC TTGCCAGCGC CCTAGCGCCC GCTCCTTTCG 

2 951 CTTTCTTCCC TTCCTTTCTC GCCACGTTCG CCGGCTTTCC CCGTCAAGCT 
3001 CTAAATCGGG GCATCCCTTT AGGGTTCCGA TTTAGTGCTT TACGGCACCT 
3051 CGACCCCAAA AAACTTGATT AGGGTGATGG TTCACGTAGT GGGCCATCGC 
3101 CCTGATAGAC GGTTTTTCGC CCTTTGACGT TGGAGTCCAC GTTCTTTAAT 
3151 AGTGGACTCT TGTTCCAAAC TGGAACAACA CTCAACCCTA TCTCGGTCTA 
32 01 TTCTTTTGAT TTATAAGGGA TTTTGGGGAT TTCGGCCTAT TGGTTAAAAA 
32 51 ATGAGCTGAT TTAACAAAAA TTTAACGCGA ATTAATTCTG TGGAATGTGT 
3301 GTCAGTTAGG GTGTGGAAAG TCCCCAGGCT CCCCAGGCAG GCAGAAGTAT 
3351 GCAAAGCATG CATCTCAATT AGTCAGCAAC CAGGTGTGGA AAGTCCCCAG 

3 401 GCTCCCCAGC AGGCAGAAGT ATGCAAAGCA TGCATCTCAA TTAGTCAGCA 
34 51 ACCATAGTCC CGCCCCTAAC TCCGCCCATC CCGCCCCTAA CTCCGCCCAG 
3 501 TTCCGCCCAT TCTCCGCCCC ATGGCTGACT AATTTTTTTT ATTTATGCAG 
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3551 


AGGCCGAGGC 


CGCCTCTGCC 


TCTGAGCTAT 








3601 


TTTTTTGGAG 


GCCTAGGCTT 


TTGCAAAAAr; 




^- i i b i Al ATC 


5 


3651 


CATTTTCGGA 


TCTGATCAAG 


AGACAGGATr; 




Cut, A xGATTG 




3701 


AACAAGATGG 


ATTGCACGCA 






tjCsAGAGGCTA 




3751 


TTCGGCTATG 


ACTGGGCACA 


ACAGACAATC 




Ax oCL-vjCUo T 




3801 


GTTCCGGCTG 


TCAGCGCAGG 


GGCGCCCGGT 


Tr'TTTTTGTr* 


AALj A(„ C CjAC C 


10 


3851 


TGTCCGGTGC 


CCTGAATGAA 


CTGCAGGACG 


AGGCAGCGTG 


GPT ATPf^T/*/* 




3901 


CTGGCCACGA 


CGGGCGTTCC 


TTGCGCAGCT 


GTGCTCGACG 


TTGTP APT^ A 
X X o 1 ^rt^^ 1 (jA 




3951 


AGCGGGAAGG 


GACTGGCTGC 


TATTGGGCGA 


AGTGCCGGGG 


P AGG ATr'Tr'r* 




4001 


TGTCATCTCA 


CCTTGCTCCT 


GCCGAGAAAG 


TATCCATCAT 


GGPTG ATGP A 


15 


4051 


ATGCGGCGGC 


TGCATACGCT 


TGATCCGGCT 


ACCTGCCCAT 


TPGAPPAPPa 




4101 


AGCGAAACAT 


CGCATCGAGC 


GAGCACGTAC 


TCGGATGGAA 


GPPGflTPTTr* 




4151 


TCGATCAGGA 


TGATCTGGAC 


GAAGAGCATC 


AGGGGCTCGC 


GPP AGT'PriA A 


20 


4201 


CTGTTCGCCA 


GGCTCAAGGC 


GCGCATGCCC 


GACGGCGAGG 


ATPTPGTPflT 
nxv^x^oXN^ol 


4251 


GACCCATGGC 


GATGCCTGCT 


TGCCGAATAT 


CATGGTGGAA 


AATGGPPGPT 




4 3 0 1 


T* T T T /T C a T^T' 
*. ^ \^ A. \j\jr\ X X 




GGCCGGCxGG 


GTGTGGCGGA 


CCGCTATPAG 




4351 


GACATAGCGT 


TGGCTACCCG 


TGATATTGCT 


GAAGAGCTTG 


GCGGPGAATG 


25 


4401 


GGCTGACCGC 


TTCCTCGTGC 


TTTACGGTAT 


CGCCGCTCCC 


GATTPGPAGP 


4451 


GCATCGCCTT 


CTATCGCCTT 


CTTGACGAGT 


TCTTCTGAGT 


GGGAPTPTPP 




4501 


GGTTCGAAAT 


GACCGACCAA 


GCGACGCCCA 


ACCTGrrATP 

\^ X vjv, x \^ 


APf^ Aft ATTTP 
AV^orlVjAl lit. 




4551 


GATTCCACCG 


CCGCCTTCTA 


TGAAAGGTTG 


GGPTTPGG A A 


rp j-i fp rp m »p ^ — 
1 L-lj 111 1 t,l*(j 


30 


4601 


GGAGGCCGGC 


TGGATGATCC 


TCCAGCGCGG 


GGATPTPATG 
yj\Dr\ X X y^n x o 


PTn/^APTTr'T 
V, 1 ooAb 1 1 C i 


4651 


TCGCCCACCC 


CAACTTGTTT 


ATTGCAGCTT 


AT A ATGi^TTA 
rtXrtrtXVjOx X/\ 


CAAAl AAAoi., 




4701 


AATAGCATCA 


CAAATTTCAC 


AAATAAAGCA 


TTTTTTTf^ Af^ 
X X X X X X XV^rlV^ 


IvjCAI lt,xAvj 




4751 


TTGTGGTTTG 


TCCAAACTCA 


TCAATGTATC 


TTATPATGTf* 
X X n X Vr/i X X 


Tr^T A T A r*r*r"T 


35 


4801 


CGACCTCTAG 


CTAGAGCTTG 


GCGTAATCAT 


GGTCATAGTT 


GTTTPPTf^TP 

V3 1 X X 1 Ol ^3 




4851 


TGAAATTGTT 


ATCCGCTCAC 


AATTCCACAC 


AACATAPGAG 

nt\y^r\ x tAv— vj/AVj 


PPnfZA ACIP AT 




4901 


AAAGTGTAAA 


GCCTGGGGTG 


CO TAATGAGT 


GAGCTAACTr 


APATTA ATTr: 

rtV^rt X X Art X 1 o 




4951 


CGTTGCGCTC 


ACTGCCCGCT 


TTCCAGTCGG 


GAAACCTGTC 


GTGPPAGPTG 


40 


5001 


CATTAATGAA 


TCGGCCAACG 


CGCGGGGAGA 


GGCGGTTTGC 


GTATTGGGPG 
uxnx xoooVvO 




5051 


CTCTTCCGCT 


TCCTCGCTCA 


CTGACTCGCT 


GCGCTCGGTC 


GTTPGGPTGP 




5101 


GGCGAGCGGT 


ATCAGCTCAC 


TCAAAGGCGG 


TAATACGGTT 


ATPP Ar* AGA A 
Al CV-AV-AoAA 




5151 


TCAGGGGATA 


ACGCAGGAAA 


GAACATGTGA 


GC AAA AGGPr 


A nP A A A A (ZCIC 
A\JV- AAAAoVjC 


45 


5201 


CAGGAACCGT 


AAAAAGGCCG 


CGTTGCTGGr 


GTTTTTPP AT 
VJ X X X X i V^Crt 1 


AboC 1 UL-tjCL 




5251 


CCCCTGACGA 


GCATCACAAA 


AATCGACGCT 


CAAGTPAGAG 


1 oiji^kjAAAv, 




5301 


CCGACAGGAC 


TAT A A Af^ ATA 




CCCCCTGGAA 


GCTCCCTCGT 




5351 


GCGCTCTCCT 


GTTCCGACCC 


TGCCGCTTAC 


CGGATACCTG 


TCCGCCTTTC 


50 


5401 


TCCCTTCGGG 


AAGCGTGGCG 


CTTTCTCAAT 


GCTCACGCTG 


TAGGTATCTC 




5451 


AGTTCGGTGT 


AGGTCGTTCG 


CTCCAAGCTG 


GGCTGTGTGC 


ACGAACCCCC 
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5 



TO 



20 



25 



30 



35 



c c rt 1 

5501 


CGTTCAGCCC 


GACCGCTGCG 


CCTTATCCGG 


TAACTATCGT 


CTTGAGTCCA 




ACCCGGTAAG 


AC AC G AC T T A 


TCGCCACTGG 


CAGCAGCCAC 


TGGTAACAGG 


5601 


ATTAGCAGAG 


CGAGGTATGT 


AGGCGGTGCT 


ACAGAGTTCT 


TGAAGTGGTG 


5651 


GCCTAACTAC 


GGCTACACTA 


GAAGGACAGT 


ATTTGGTATC 


TGCGCTCTGC 


5701 


TGAAGCCAGT 


TACCTTCGGA 


AAAAGAGTTG 


GTAGCTCTTG 


ATCCGGCAAA 


5751 


CAAACCACCG 


CTGGT AGO GG 


TGGTTTTTTT 


GTTTGCAAGC 


AGCAGATTAC 


5801 


GCGCAGAAAA 


AAAGGATCTC 


AAGAAGATCC 


TTTGATCTTT 


TCTACGGGGT 


5851 


CTGACGCTCA 


GTGGAACGAA 


AACTCACGTT 


AAGGGATTTT 


GGTCATGAGA 


5901 


TTATCAAAAA 


GGATCTTCAC 


CTAGATCCTT 


TTAAATTAAA 


AATGAAGTTT 


5951 


TAAATCAATC 


TAAAGTATAT 


ATGAGTAAAC 


TTGGTCTGAC 


AGTTACCAAT 


6001 


GCTTAATCAG 


TGAGGCACCT 


ATCTCAGCGA 


TCTGTCTATT 


TCGTTCATCC 


6051 


ATAGTTGCCT 


GACTCCCCGT 


CGTGTAGATA 


ACT AC GAT AC 


GGGAGGGCTT 


6101 


ACCATCTGGC 


CCCAGTGCTG 


CAATGATACC 


GCGAGACCCA 


CGCTCACCGG 


6151 


CTCCAGATTT 


ATCAGCAATA 


AACCAGCCAG 


CCGGAAGGGC 


CGAGCGCAGA 


6201 


AGTGGTCCTG 


CAACTTTATC 


CGCCTCCATC 


CAGTCTATTA 


ATTGTTGCCG 


62 51 


GGAAGCTAGA 


GTAAGTAGTT 


CGCCAGTTAA 


TAGTTTGCGC 


AACGTTGTTG 


6301 


CCATTGCTAC 


1h y^ y— ■ y-« m m >4 y^ 

AGGCATCGTG 


GTGTCACGCT 


CGTCGTTTGG 


TATGGCTTCA 


6351 


TTCAGCTCCG 


GTTCCCAACG 


ATCAAGGCGA 


GTTACATGAT 


CCCCCATGTT 


6401 


GTGCAAAAAA 


GCGGTTAGCT 


CCTTCGGTCC 


TCCGATCGTT 


GTCAGAAGTA 


6451 


AGTTGGCCGC 


AGTGTTATCA 


CTCATGGTTA 


TGGCAGCACT 


GCATAATTCT 


650 1 


CTTACTGTCA 


TGCCATCCGT 


Ik 4k y— n Ik m^*^^#fftmMn 

AAGATGCTTT 


TCTGTGACTG 


GTGAGTACTC 


6551 


AACCAAGTCA 


fn m y^ ik y^ ^ m 

TTCTGAGAAT 


AGTGTATGCG 


GCGACCGAGT 


TGCTCTTGCC 


6601 


CGGCGTCAAT 


ACGGGATAAT 


ACCGCGCCAC 


ATAGCAGAAC 


TTTAAAAGTG 


6651 


CTCATCATTG 


GAAAACGTTC 


TTCGGGGCGA 


AAACTCTCAA 


GGATCTTACC 


6701 


GCTGTTGAGA 


TCCAGTTCGA 


TGTAACCCAC 


TCGTGCACCC 


AACTGATCTT 


6751 


CAGCATCTTT 


TACTTTCACC 


AGCGTTTCTG 


GGTGAGCAAA 


AACAGGAAGG 


6801 


CAAAATGCCG 


CAAAAAAGGG 


AATAAGGGCG 


ACACGGAAAT 


GTTGAATACT 


6851 


CATACTCTTC 


CTTTTTCAAT 


ATTATTGAAG 


CATTTATCAG 


GGTTATTGTC 


6901 


TCATGAGC GG 


ATACATATTT 


GAATGTATTT 


AGAAAAATAA 


ACAAATAGGG 


6951 


GTTCCGCGCA 


CATTTCCCCG 


AAAAGTGCCA 


CCTGACGTCG 


ACGGATCGGG 



Tabeile 1 1 : Nukleotidsequenz des rekombinanlen Plasmids pIND-H-SemaL-EA (SEQ ID NO.: 38) 

45 

1 AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT 
51 TGTTCTCGTT AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC 
101 GATGGACAAG TGCATTGTTC TCTTGCTGAA AGCTCGATGG ACAAGTGCAT 

50 

151 TGTTCTCTTG CTGAAAGCTC AGTACCCGGG AGTACCCTCG ACCGCCGGAG 
2 01 TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT TCAAACAAGC 
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2 51 AAAGTGAACA CGTCGCTAAG 
301 GAACAAGCTA AACAATCTGC 

3 51 AAAGTAACCA GCAACCAAGT 
401 GAAGTAATTA TTGAATACAA 
451 ACCGAGAAAG AAGAACTCAC 
501 ACCGAGCTCG GATCCACTAG 
551 cqcctcctcc gcccggacgt 
601 cctggcccgc cggctcggtt 
651 gctgctctgg gcggccgccg 
701 cccgcatctt cgccgtctgg 
751 tttggccaga ctgagccgca 
801 ctctgtgtgg gtgggaggac 
851 agggcaagaa cgcatctgtg 
901 tcctgtctgg ataagcggga 
951 gcggagtgag gggctgctgg 

1001 gctggaacct ggtgaatggc 
1051 tacgccccct tcagcccgga 
1101 cgaggtgtat tccaccatcc 
1151 ggttccgccg catccggggc 
1201 atgcagaacc cacagttcat 
1251 ttacgatgac aagatctact 
1301 atcctgaggc tcctctcaat 
1351 gaccagggtg gggaaagttc 
1401 gaaagccatg ctggtatgca 
1451 ggctgcaaga cgtcttcctg 
1501 accagggtct atggtgtttt 
1551 tgtgtattcc ctcggtgaca 
1601 agggctacca ctcaagcctt 
1651 gaccagcagc cgatacccac 
1701 agaggtggcg cagagggtgg 
1751 tccactctaa ataccactac 
1801 agccacgggg agacctttca 
1851 tatccacaag gtggtggaac 
1901 acatcatgga gatccagccc 
1951 tcgctggatg ctgagcggag 
2001 gagccaggtg cccctggacc 
2051 gttgcctcat gtcccgagac 
2101 atctccatct acagctccga 
2151 cgagccacac aaggagtgtc 



CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 
AGTAAAGTGC AAGTTAAAGT GAATCAATTA 
AAATCAACTG CAACTACTGA AATCTGCCAA 
GAAGAGAACT CTGAATACTT TCAACAAGTT 
ACACAGCTAG CGTTTAAACT TAAGCTTGGT 
TCCAGTGTGG TGgaattcgg cttgggatga 
gccgccccca gcgcaccgcg cgcccgcgtc 
ggggcttccg ctgcggctgc ggctgctgct 
cctccgccca gggccaccta aggagcggac 
aaaggccatg tagggcagga ccgggtggac 
cacggtgctt ttccacgagc caggcagctc 
gtggcaaggt ctacctcttt gacttccccg 
cgcacggtga atatcggctc cacaaagggg 
ctgcgagaac tacatcactc tcctggagag 
cctgtggcac caacgcccgg caccccagct 
actgtggtgc cacttggcga gatgagaggc 
cgagaactcc ctggttctgt ttgaagggga 
ggaagcagga atacaatggg aagatccctc 
gagagtgagc tgtacaccag tgatactgtc 
caaagccacc atcgtgcacc aagaccaggc 
acttcttccg agaggacaat cctgacaaga 
gtgtcccgtg tggcccagtt gtgcaggggg 
actgtcagtc tccaagtgga acacttttct 
gtgatgctgc caccaacaag aacttcaaca 
ctccctgacc ccagcggcca gtggagggac 
ctccaacccc tggaactact cagccgtctg 
ttgacaaggt cttccgtacc tcctcactca 
cccaacccgc ggcctggcaa gtgcctccca 
agagaccttc caggtggctg accgtcaccc 
agcccatggg gcctctgaag acgccattgt 
cagaaagtgg ccgttcaccg catgcaagcc 
tgtgctttac ctaactacag acaggggcac 
cgggggagca ggagcacagc ttcgccttca 
ttccgccgcg cggctgccat ccagaccatg 
gaagctgtat gtgagctccc agtgggaggt 
tgtgtgaggt ctatggcggg ggctgccacg 
ccctactgcg gctgggacca gggccgctgc 
acggtcagtg ctgcaatcca ttaatccagc 
ccaaccccaa accagacaag gccccactgc 



EP 0 892 047 A2 



2201 agaaggtttc cctggcccca aactctcgct actacctgag ctgccccatg 
2251 gaatcccgcc acgccaccta ctcatggcgc cacaaggaga acgtggagca 
2301 gagctgcgaa cctggtcacc agagccccaa ctgcatcctg ttcatcgaga 
2351 acctcacggc gcagcagtac ggccactact tctgcgaggc ccaggagggc 
2401 tcctacttcc gcgaggctca gcactggcag ctgctgcccg aggacggcat 
2451 catggccgag cacctgctgg gtcatgcctg tgccctggct gcctccctct 
2501 ggctgggggt gctgcccaca ctcactcttg gcttgctggt ccacgtgaag 
2551 cttGGGCCCG AACAAAAACT CATCTCAGAA GAGGATCTGA ATAGCGCCGT 
2601 CGACCATCAT CATCATCATC ATTGAGTTTA TCCAGCACAG TGGCGGCCGC 
2 651 TCGAGTCTAG AGGGCCCGTT TAAACCCGCT GATCAGCCTC GACTGTGCCT 
27 01 TCTAGTTGCC AGCCATCTGT TGTTTGCCCC TCCCCCGTGC CTTCCTTGAC 

27 51 CCTGGAAGGT GCCACTCCCA CTGTCCTTTC CTAATAAAAT GAGGAAATTG 
2801 CATCGCATTG TCTGAGTAGG TGTCATTCTA TTCTGGGGGG TGGGGTGGGG 

28 51 CAGGACAGCA AGGGGGAGGA TTGGGAAGAC AATAGCAGGC ATGCTGGGGA 
2 901 TGGGGTGGGG TCTATGGCTT CTGAGGCGGA AAGAACCAGC TGGGGCTCTA 

2 951 GGGGGTATCC CCACGCGCCC TGTAGCGGCG CATTAAGCGC GGCGGGTGTG 
3001 GTGGTTACGC GCAGCGTGAC CGCTACACTT GCCAGCGCCC TAGCGCCCGC 
3051 TCCTTTCGCT TTCTTCCCTT CCTTTCTCGC CACGTTCGCC GGCTTTCCCC 
3101 GTCAAGCTCT AAATCGGGGC ATCCCTTTAG GGTTCCGATT TAGTGCTTTA 
3151 CGGCACCTCG ACCCCAAAAA ACTTGATTAG GGTGATGGTT CACGTAGTGG 
32 01 GCCATCGCCC TGATAGACGG TTTTTCGCCC TTTGACGTTG GAGTCCACGT 
32 51 TCTTTAATAG TGGACTCTTG TTCCAAACTG GAACAACACT CAACCCTATC 
3301 TCGGTCTATT CTTTTGATTT ATAAGGGATT TTGGGGATTT CGGCCTATTG 
3351 GTTAAAAAAT GAGCTGATTT AACAAAAATT TAACGCGAAT TAATTCTGTG 
3401 GAATGTGTGT CAGTTAGGGT GTGGAAAGTC CCCAGGCTCC CCAGGCAGGC 
3451 AGAAGTATGC AAAGCATGCA TCTCAATTAG TCAGCAACCA GGTGTGGAAA 
3501 GTCCCCAGGC TCCCCAGCAG GCAGAAGTAT GCAAAGCATG CATCTCAATT 
3551 AGTCAGCAAC CATAGTCCCG CCCCTAACTC CGCCCATCCC GCCCCTAACT 

3 601 CCGCCCAGTT CCGCCCATTC TCCGCCCCAT GGCTGACTAA TTTTTTTTAT 
3651 TTATGCAGAG GCCGAGGCCG CCTCTGCCTC TGAGCTATTC CAGAAGTAGT 
37 01 GAGGAGGCTT TTTTGGAGGC CTAGGCTTTT GCAAAAAGCT CCCGGGAGCT 

37 51 TGTATATCCA TTTTCGGATC TGATCAAGAG ACAGGATGAG GATCGTTTCG 

38 01 CATGATTGAA CAAGATGGAT TGCACGCAGG TTCTCCGGCC GCTTGGGTGG 
38 51 AGAGGCTATT CGGCTATGAC TGGGCACAAC AGACAATCGG CTGCTCTGAT 
3901 GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG CGCCCGGTTC TTTTTGTCAA 

3 951 GACCGACCTG TCCGGTGCCC TGAATGAACT GCAGGACGAG GCAGCGCGGC 
4001 TATCGTGGCT GGCCACGACG GGCGTTCCTT GCGCAGCTGT GCTCGACGTT 

4 051 GTCACTGAAG CGGGAAGGGA CTGGCTGCTA TTGGGCGAAG TGCCGGGGCA 
4101 GGATCTCCTG TCATCTCACC TTGCTCCTGC CGAGAAAGTA TCCATCATGG 
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4151 


CTGATGCAAT 


GCGGCGGCTG 


CATACGCTTG 


ATCCGGCTAC 


CTGCCP ATTP 




4201 


GACCACCAAG 


CGAAACATCG 


CATCGAGCGA 


GCACGTACTC 


G G A T G A A 


5 


4251 


CGGTCTTGTC 


GATCAGGATG 


ATCTGGACGA 


AGAGCATCAG 






4301 


CAGCCGAACT 


GTTCGCCAGG 


CTCAAGGCGC 


GCATGCCCGA 


CGGCGAGGAT 




4351 


CTCGTCGTGA 


CCCATGGCGA 


TGCCTGCTTG 


CCGAATATCA 


TGGTGGAAAA 




4401 


TGGCCGCTTT 


TCTGGATTCA 


TCGACTGTGG 


CCGGCTGGGT 


GTGGCGGACC 


W 


4451 


GCTATCAGGA 


CATAGCGTTG 


GCTACCCGTG 


ATATTGCTGA 


AGAGCTTGGC 




4501 


GGCGAATGGG 


CTGACCGCTT 


CCTCGTGCTT 


TACGGTATCG 


CCGCTCCCGA 




4551 


TTCGCAGCGC 


ATCGCCTTCT 


ATCGCCTTCT 


TGACGAGTTC 


TTCTGAGCGG 




4601 


GACTCTGGGG 


TTCGAAATGA 


CCGACCAAGC 


GACGCCCAAC 


CTGCCATCAr 


J5 


4651 


GAGATTTCGA 


TTCCACCGCC 


GCCTTCTATG 


AAAGGTTGGG 


CTTCGGAATC 




4701 


GTTTTCCGGG 


ACGCCGGCTG 


GATGATCCTC 


CAGCGCGGGG 


ATCTCATGCT 




4751 


GGAGTTCTTC 


GCCCACCCCA 


ACTTGTTTAT 


TGCAGCTTAT 


AATGGTTACA 


20 


4801 


AATAAAGCAA 


TAGCATCACA 


AATTTCACAA 


ATAAAGCATT 


TTTTTCACTG 


4851 


CATTCTAGTT 


GTGGTTTGTC 


CAAACTCATC 


AATGTATCTT 


ATCATGTCTG 




t w X 


TATACCGTCG 


ACCTCTAGCT 


AGAGCTTGGC 


GTAATCATGG 


TCATAGCTGT 




4951 


TTCCTGTGTG 


AAATTGTTAT 


CCGCTCACAA 


TTCCACACAA 


CATACGAGCC 


25 


5001 


GGAAGCATAA 


AGTGTAAAGC 


CTGGGGTGCC 


TAATGAGTGA 


GCTAACTCAC 


5051 


ATTAATTGCG 


TTGCGCTCAC 


TGCCCGCTTT 


CCAGTCGGGA 


AACCTGTCGT 




5101 


GCCAGCTGCA 


TTAATGAATC 


GGCCAACGCG 


CGGGGAGAGG 


CGGTTTGCGT 




5151 


ATTGGGCGCT 


CTTCCGCTTC 


CTCGCTCACT 


GACTCGCTGC 


GCTCGGTCGT 


30 


5201 


TCGGCTGCGG 


CGAGCGGTAT 


CAGCTCACTC 


AAAGGCGGTA 


ATACGGTTAT 




5251 


CCACAGAATC 


AGGGGATAAC 


GCAGGAAAGA 


ACATGTGAGC 


AAAAGGCCAG 




5301 


CAAAAGGCCA 


GGAACCGTAA 


AAAGGCCGCG 


TTGCTGGCGT 


TTTTCCATAG 




5351 


GCTCCGCCCC 


CCTGACGAGC 


ATCACAAAAA 


TCGACGCTCA 


AGTCAGAGGT 


35 


5401 


GGCGAAACCC 


GACAGGACTA 


TAAAGATACC 


AGGCGTTTCC 


CCCTGGAAGC 




5451 


TCCCTCGTGC 


GCTCTCCTGT 


TCCGACCCTG 


CCGCTTACCG 


GATACCTGTC 




5501 


CGCCTTTCTC 


CCTTCGGGAA 


GCGTGGCGCT 


TTCTCAATGC 


TCACGCTGTA 




5551 


GGTATCTCAG 


TTCGGTGTAG 


GTCGTTCGCT 


CCAAGCTGGG 


CTGTGTGCAC 


40 


5601 


GAACCCCCCG 


TTCAGCCCGA 


CCGCTGCGCC 


TTATCCGGTA 


ACTATCGTCT 




5651 


TGAGTCCAAC 


CCGGTAAGAC 


ACGACTTATC 


GCCACTGGCA 


GCAGCCACTG 




5701 


GTAACAGGAT 


TAGCAGAGCG 


AGGTATGTAG 


GCGGTGCTAC 


AGAGTTCTTG 


45 


5751 


AAGTGGTGGC 


CTAACTACGG 


CTACACTAGA 


AGGACAGTAT 


TTGGTATCTG 


5801 


CGCTCTGCTG 


AAGCCAGTTA 


CCTTCGGAAA 


AAGAGTTGGT 


AGCTCTTGAT 




5851 


CCGGCAAACA 


AACCACCGCT 


GGTAGCGGTG 


GTTTTTTTGT 


TTGCAAGCAG 




5901 


CAGATTACGC 


GCAGAAAAAA 


AGGATCTCAA 




X ori 1 X IX X 


50 


5951 


TACGGGGTCT 


GACGCTCAGT 


GGAACGAAAA 


CTCACGTTAA 


GGGATTTTGG 


6001 


TCATGAGATT 


ATCAAAAAGG 


ATCTTCACCT 


AGATCCTTTT 


AAATTAAAAA 




6051 


TGAAGTTTTA 


AATCAATCTA 


AAGTATATAT 


GAGTAAACTT 


GGTCTGACAG 
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6101 


TTACCAATGC 


TTAATCAGTG 


AGGCACCTAT 


CTCAGCGATC 


TGTCTATTTC 




6151 


GTTCATCCAT 


AGTTGCCTGA 


CTCCCCGTCG 


TGTAGATAAC 


TACGATACGG 


5 


6201 


GAGGGCTTAC 


CATCTGGCCC 


CAGTGCTGCA 


ATGATACCGC 


GAGACCCACG 




6251 


CTCACCGGCT 


CCAGATTTAT 


CAGCAATAAA 


CCAGCCAGCC 


GGAAGGGCCG 




6301 


AGCGCAGAAG 


TGGTCCTGCA 


ACTTTATCCG 


CCTCCATCCA 


GTCTATTAAT 




6351 


TGTTGCCGGG 


AAGCTAGAGT 


AAGTAGTTCG 


CCAGTTAATA 


GTTTGCGCAA 


10 


6401 


CGTTGTTGCC 


ATTGCTACAG 


GCATCGTGGT 


GTCACGCTCG 


TCGTTTGGTA 




6451 


TGGCTTCATT 


CAGCTCCGGT 


TCCCAACGAT 


CAAGGCGAGT 


TACATGATCC 




6501 


CCCATGTTGT 


GCAAAAAAGC 


GGTTAGCTCC 


TTCGGTCCTC 


CGATCGTTGT 




6551 


CAGAAGTAAG 


TTGGCCGCAG 


TGTTATCACT 


CATGGTTATG 


GCAGCACTGC 


15 


6601 


ATAATTCTCT 


TACTGTCATG 


CCATCCGTAA 


GATGCTTTTC 


TGTGACTGGT 




6651 


GAGTACTCAA 


CCAAGTCATT 


CTGAGAATAG 


TGTATGCGGC 


GACCGAGTTG 




6701 


CTCTTGCCCG 


GCGTCAATAC 


GGGATAATAC 


CGCGCCACAT 


AGCAGAACTT 




6751 


TAAAAGTGCT 


CATCATTGGA 


AAACGTTCTT 


CGGGGCGAAA 


ACTCTCAAGG 


20 


6801 


ATCTTACCGC 


TGTTGAGATC 


CAGTTCGATG 


TAACCCACTC 


GTGCACCCAA 




6851 


CTGATCTTCA 


GCATCTTtTA 


CTTTCACCAG 


CGTTTCTGGG 


TGAGCAAAAA 




6901 


CAGGAAGGCA 


AAATGCCGCA 


AAAAAGGGAA 


TAAGGGCGAC 


ACGGAAATGT 




6951 


TGAATACTCA 


TACTCTTCCT 


TTTTCAATAT 


TATTGAAGCA 


TTTATCAGGG 


25 


7001 


TTATTGTCTC 


ATGAGCGGAT 


ACATATTTGA 


ATGTATTTAG 


AAAAATAAAC 




7051 


AAATAGGGGT 


TCCGCGCACA 


TTTCCCCGAA 


AAGTGCCACC 


TGACGTCGAC 




7101 


GGATCGGG 











30 

Tabelle 1 2: Sequenz des rekombinanten Rasmids pQE30-H-SemaL-BH (SEQ ID NO.: 39) 



40 



45 



50 



1 


CTCGAGAAAT 


CATAAAAAAT 


tTATTTGCTT 


TGTGAGCGGA 


TAACAATTAT 


51 


AATAGATTCA 


ATTGTGAGCG 


GATAACAATT 


TCACACAGAA 


TTCATTAAAG 


101 


AGGAGAAATT 


AACTATGAGA 


GGATCGCATC 


ACCATCACCA 


TCACGGAtcc 


151 


ctggttctgt 


ttgaagggga 


cgaggtgtat 


tccaccatcc 


ggaagcagga 


201 


atacaatggg 


aagatccctc 


ggttccgccg 


catccggggc 


gagagtgagc 


251 


tgtacaccag 


tgatactgtc 


atgcagaacc 


cacagttcat 


caaagccacc 


301 


atcgtgcacc 


aagaccaggc 


ttacgatgac 


aagatctact 


acttcttccg 


351 


agaggacaat 


cctgacaaga 


atcctgaggc 


tcctctcaat 


gtgtcccgtg 


401 


tggcccagtt 


gtgcaggggg 


gaccagggtg 


gggaaagttc 


actgtcagtc 


451 


tccaagtgga 


acacttttct 


gaaagccatg 


ctggtatgca 


gtgatgctgc 


501 


caccaacaag 


aacttcaaca 


ggctgcaaga 


cgtcttcctg 


ctccctgacc 


551 


ccagcggcca 


gtggagggac 


accagggtct 


atggtgtttt 


ctccaacccc 


601 


tggaactact 


cagccgtctg 


tgtgtattcc 


ctcggtgaca 


ttgacaaggt 


651 


cttccgtacc 


tcctcactca 


agggctacca 


ctcaagcctt 


cccaacccgc 
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15 



20 



25 



30 



40 



45 



50 



701 


ggcctggcaa 


gtgcctccca 


gaccagcagc 


cgatacccac 


aaaAAGCTTfl 


751 


ATTAGCTGAG 


CTTGGACTCC 


TGTTGATAGA 


TCCAGTAATG 


ACCTCAGAAP 


801 


TCCATCTGGA 


TTTGTTCAGA ACGCTCGGTT 


GCCGCCGGGC 


GTTTTTTATT 


851 


GGTGAGAATC 


CAAGCTAGCT 


TGGCGAGATT 


TTCAGGAGCT 




901 


AAATGGAGAA 


AAAAATCACT 


GGATATACCA 


CCGTTGATAT 




951 


CATCGTAAAG 


AACATTTTGA 


GGCATTTCAG 


TCAGTTGCTC 


AATGTAPPTA 


1001 


TAACCAGACC 


GTTCAGCTGG 


ATATTACGGC 


CTTTTTAAAG 


ACCGTAAA(^A 


1051 


AAAATAAGCA 


CAAGTTTTAT 


CCGGCCTTTA 


TTCACATTCT 


TGCCCGCCTG 


1101 


ATGAATGCTC 


ATCCGGAATT 


TCGTATGGCA 


ATGAAAGACG 


GTGAGCTGGT 


1151 


GATATGGGAT 


AGTGTTCACC 


CTTGTTACAC 


CGTTTTCCAT 


GAGCAAACTG 


1201 


AAACGTTTTC 


ATCGCTCTGG 


AGTGAATACC 


ACGACGATTT 


CCGGCAGTTT 


1251 


CTACACATAT 


ATTCGCAAGA 


TGTGGCGTGT 


TACGGTGAAA ACCTGGCCTA 


1301 


TTTCCCTAAA 


GGGTTTATTG 


AGAATATGTT 


TTTCGTCTCA 


GCCAATCCCT 


1351 


GGGTGAGTTT 


CACCAGTTT7 


GATTTAAACG 


TGGCCAATAT 


GGACAACTTC 


1401 


TTCGCCCCCG 


TTTTCACCAT 


GGGCAAATAT 


TATACGCAAG 


GCGACAAGGT 


1451 


GCTGATGCCG 


CTGGCGATTC 


AGGTTCATCA 


TGCCGTCTGT 


GATGGCTTCC 


1501 


ATGTCGGCAG 


AATGCTTAAT 


GAATTACAAC 


AGTACTGCGA 


TGAGTGGCAG 


1551 


GGCGGGGCGT 


AATTTTTTTA 


AGGCAGTTAT 


TGGTGCCCTT 


AAACGCCTGG 


1601 


GGTAATGACT 


CTCTAGCTTG 


AGGCATCAAA 


TAAAACGAAA 


GGCTCAGTCG 


1651 


AAAGACTGGG 


CCTTTCGTTT 


TATCTGTTGT 


TTGTCGGTGA 


ACGCTCTCCT 


1701 


GAGTAGGACA 


AATCCGCCGC 


TCTAGAGCTG 


CCTCGCGCGT 


TTCGGTGATG 


1751 


ACGGTGAAAA 


CCTCTGACAC 


ATGCAGCTCC 


CGGAGACGGT CACAGCTTGT 


1801 


CTGTAAGCGG 


ATGCCGGGAG 


CAGACAAGCC 


CGTCAGGGCG 


CGTCAGCGGG 


1851 


TGTTGGCGGG 


TGTCGGGGCG 


CAGCCATGAC 


CCAGTCACGT 


AGCGATAGCG 


1901 


GAGTGTATAC 


TGGCTTAACT 


ATGCGGCATC 


AGAGCAGATT 


GTACTGAGAG 


1951 


TGCACCATAT 


GCGGTGTGAA 


ATACCGCACA 


GATGCGTAAG 


GAGAAAATAC 


2001 


CGCATCAGGC 


GCTCTTCCGC 


TTCCTCGCTC 


ACTGACTCGC 


TGCGCTCGGT 


2051 


CTGTCGGCTG 


CGGCGAGCGG 


TATCAGCTCA 


CTCAAAGGCG 


GTAATACGGT 


2101 


TATCCACAGA 


ATCAGGGGAT 


AACGCAGGAA 


AGAACATGTG 


AGCAAAAGGC 


2151 


CAGCAAAAGG 


CCAGGAACCG 


TAAAAAGGCC 


GCGTTGCTGG 


CGTTTTTCCA 


2201 


TAGGCTCCGC 


CCCCCTGACG 


AGCATCACAA AAATCGACGC TCAAGTCAGA 


2251 


GGTGGCGAAA 


CCCGACAGGA 


CTATAAAGAT 


ACCAGGCGTT 


TCCCCCTGGA 


2301 


AGCTCCCTCG 


TGCGCTCTCC 


TGTTCCGACC 


CTGCCGCTTA 


CCGGATACCT 


2351 


GTCCGCCTTT 


CTCCCTTCGG 


GAAGCGTGGC 


GCTTTCTCAA 


TGCTCACGCT 


2401 


GTAGGTATCT 


CAGTTCGGTG 


TAGGTCGTTC 


GCTCCAAGCT 


GGGCTGTGTG 


2451 


CACGAACCCC 


CCGTTCAGCC 


CGACCGCTGC 


GCCTTATCCG 


GTAACTATCG 


2501 


TCTTGAGTCC 


AACCCGGTAA 


GACACGACTT 


ATCGCCACTG 


GCAGCAGCCA 


2551 


CTGGTAACAG 


GATTAGCAGA 


GCGAGGTATG 


TAGGCGGTGC 


TACAGAGTTC 


2601 


TTGAAGTGGT 


GGCCTAACTA 


CGGCTACACT 


AGAAGGACAG 


TATTTGGTAT 
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5 



10 



20 



25 



30 



35 



2651 


CTGCGCTCTG 


CTGAAGCCAG 


TTACCTTCGG 


AAAAAGAGTT 


GGTAGCTCTT 


2701 


GATCCGGCAA 


ACAAACCACC 


GCTGGTAGCG 


GTGGTTTTTT 


TGTTTGCAAG 


2751 


CAGCAGATTA 


CGCGCAGAAA 


AAAAGGATCT 


CAAGAAGATC 


CTTTGATCTT 


2801 


TTCTACGGGG 


TCTGACGCTC 


AGTGGAACGA 


AAACTCACGT 


TAAGGGATTT 


2851 


TGGTCATGAG 


ATTATCAAAA 


AGGATCTTCA 


CCTAGATCCT 


TTTAAATTAA 


2901 


AAATGAAGTT 


TTAAATCAAT 


CTAAAGTATA 


TATGAGTAAA 


CTTGGTCTGA 


2951 


CAGTTACCAA 


TGCTTAATCA 


GTGAGGCACC 


TATCTCAGCG 


ATCTGTCTAT 


3001 


TTCGTTCATC 


CATAGCTGCC 


TGACTCCCCG 


TCGTGTAGAT 


AACTACGATA 


3051 


CGGGAGGGCT 


TACCATCTGG 


CCCCAGTGCT 


GCAATGATAC 


CGCGAGACCC 


3101 


ACGCTCACCG 


GCTCCAGATT 


TATCAGCAAT 


AAACCAGCCA 


GCCGGAAGGG 


3151 


CCGAGCGCAG 


AAGTGGTCCT 


GCAACTTTAT 


CCGCCTCCAT 


CCAGTCTATT 


3201 


AATTGTTGCC 


GGGAAGCTAG 


AGTAAGTAGT 


TCGCCAGTTA 


ATAGTTTGCG 


3251 


CAACGTTGTT 


GCCATTGCTA 


CAGGCATCGT 


GGTGTCACGC 


TCGTCGTTTG 


3301 


GTATGGCTTC 


ATTCAGCTCC 


GGTTCCCAAC 


GATCAAGGCG 


AGTTACATGA 


3351 


TCCCCCATGT 


TGTGCAAAAA 


AGCGGTTAGC 


TCCTTCGGTC 


CTCCGATCGT 


3401 


TGTCAGAAGT 


AAGTTGGCCG 


CAGTGTTATC 


ACTCATGGTT 


ATGGCAGCAC 


3451 


TGCATAATTC 


TCTTACTGTC 


ATGCCATCCG 


TAAGATGCTT 


TTCTGTGACT 


3501 


GGTGAGTACT 


CAACCAAGTC 


ATTCTGAGAA 


TAGTGTATGC 


GGCGACCGAG 


3551 


TTGCTCTTGC 


CCGGCGTCAA 


TACGGGATAA 


TACCGCGCCA 


CATAGCAGAA 


3601 


CTTTAAAAGT 


GCTCATCATT 


GGAAAACGTT 


CTTCGGGGCG 


AAAACTCTCA 


3651 


AGGATCTTAC 


CGCTGTTGAG 


ATCCAGTTCG 


ATGTAACCCA 


CTCGTGCACC 


3701 


CAACTGATCT 


TCAGCATCTT 


TTACTTTCAC 


CAGCGTTTCT 


GGGTGAGCAA 


3751 


AAACAGGAAG 


GCAAAATGCC 


GCAAAAAAGG 


GAATAAGGGC 


GACACGGAAA 


3801 


TGTTGAATAC 


TCATACTCTT 


CCTTTTTCAA 


TATTATTGAA 


GCATTTATCA 


3851 


GGGTTATTGT 


CTCATGAGCG 


GAT AC AT ATT 


TGAATGTATT 


TAGAAAAATA 


3901 


AACAAATAGG 


GGTTCCGCGC 


ACATTTCCCC 


GAAAAGTGCC 


ACCTGACGTC 


3951 


TAAGAAACCA 


TTATTATCAT 


GACATTAACC 


TATAAAAATA 


GGCGTATCAC 


4001 


GAGGCCCTTT 


CGTCTTCAC 









40 

Tabeile 13: Sequenz des rekombinanten Plasmids pQE31-H-SemaL-SH (SEQ ID NO.: 40) 

1 CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT 

45 

51 AATAGATTCA ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG 

101 AGGAGAAATT AACTATGAGA GGATCGCATC ACCATCACCA TCACACGGAT 

151 CCGCATGCga gctcccagtg ggaggtgagc caggtgcccc tggacctgtg 

201 tgaggtctat ggcgggggct gccacggttg cctcatgtcc cgagacccct 

251 actgcggctg ggaccagggc cgctgcatct ccatctacag ctccgaacgg 

301 tcagtgctgc aatccattaa tccagccgag ccacacaagg agtgtcccaa 
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351 


ccccaaacca 


gacaaggccc 


cactgcagaa 




/*T ^ — i ■^m4* 

y ccccaaac u 




401 


ctcgctacta 


cctgagctgc 


cccatggaat 


cccgccacgc 




5 


451 


tggcgccaca 


aggagaacgt 


ggagcagagc 


tgcgaacctg 


g't.caccagag 




501 


ccccaactgc 


atcctgttca 


tcgagaacct 


cacggcgcag 


cagtacggcc 




551 


actacttctg 


cgaggcccag 


gagggctcct acttccgcga 


ggctcagcac 




601 


tggcagctgc 


tqcccqaaaa 


cggcatcatg 


gccgagcacc 


tgctgggtca 


10 


651 


tgcctgtgcc 


ctggctgcct 


ccctctggct 


gggggtgctg 


cccacactca 




701 


ctcttggctt 


gctggtccac 


gtgaagcttA ATTAGCTGAG CTTGGACTCC 




751 


TGTTGATAGA 


TCCAGTAATG 


ACCTCAGAAC 


TPPATPTr:r:a 


ITTGTTCAGA 




801 


ACGCTCGGTT 


GCCGCCGGGC 


GTTTTTTATT 




(-AAWJTAGCT 


15 


851 


TGGCGAGATT 


TTCAGGAGCT 


AAGGAAGCTA 


AA ATCCAPA A 


AAAAATCACT 




901 


GGATATACCA 


CCGTTGATAT 


ATCCCAATGG 


P ATPnT A A AP 


AAC AT T T T G A 




951 


GGCATTTCAG 


TCAGTTGCTC 


AATGTACCTA 


T A APPAriArr* 


(jTTCAGCTGG 


20 


1001 


ATATTACGGC 


CTTTTTAAAG 


ACCGTAAAGA 


A A A ATA AriP A 


L,AAGTTTTAT 


1051 


CCGGCCTTTA 


TTCACATTCT 


TGCCCGCCTG 


ATr^A AT/IPTr* 
rt X \3t\i\ 1 vn^ i 


Al LCGGAATT 




1 1 O 1 

J. X V X 


TCGTATGGCA 


ATGAAAGACG 


GTGAGCTGGT 


PATATPPPAT 
^A X A X ^jVj*jA X 


AGTGTTCACC 




1151 


CTTGTTACAC 


CGTTTTCCAT 


GAGCAAACTG 


A A APriTTTTr* 
AAAC vj X 11 


AxCGCTCTGG 


25 


1201 


AGTGAATACC 


AC GAG GAT TT 


CCGGCAGTTT 


PT AP AP AT AT 
V- X A^ A^- A 1 A 1 


ATTCGCAAGA 


1251 


TGTGGCGTGT 


TACGGTGAAA 




1 1 ICUL 1 AAA 


GGGTTTATTG 




1301 


AGAATATGTT 


TTTCGTCTCA 




(jijo 1 tjAo 111 


CACCAGTTTT 




1351 


GATTTAAACG 


TGGCCAATAT 




'p np/^ (~ir^ f f 


TTTTCACCAT 


30 


1401 


GGGCAAATAT 


TATACGCAAG 




ot^ X (jATGCCG 


CTGGCGATTC 




1451 


AGGTTCATCA 


TGCCGTCTGT 




A 1 Vj 1 CjCjC AG 


AAT GC T T AAT 




1501 


GAATTACAAC 


AGTACTGCGA 


TGAGTGGPAr; 


ooVjVjL. vj 1 


AATTTTTTTA 




1551 


AGGCAGTTAT 


TGGTGCCCTT 


AAAPnPPTf^r*; 


tjVj 1 AA 1 AC 1 


^'P/^fTl /^/^mmy-» 

CTCTAGCTTG 


35 


1601 


AGGCATCAAA 


TAAAACGAAA 


GGPTPAi^TPn 


AAAtjAU 1 CjGG 


CCTTTCGTTT 




1651 


TATCTGTTGT 


TTGTCGGTGA 


APGPTPTPPT 


oAU 1 ACjCaAC A 


AATCCGCCGC 




1701 


TCTAGAGCTG 


CCTCGCGCGT 


i iCbGTGATG 


ACGGTGAAAA 


CCTCTGACAC 




1751 


ATGCAGCTCC 


CGGAGACGHT 


CACAGCTTGT 


CTGTAAGCGG 


ATGCCGGGAG 


40 


1801 


CAGACAAGCC 


CGTCAGGGCG 


CGTCAGCGGG 


TGTTGGCGGG 


TGTCGGGGCG 




1851 


CAGCCATGAC 


CCAGTCACGT 


AGCGATAGCG 


GAGTGTATAC 


TGGCTTAACT 




1901 


ATGCGGCATC 


AGAGCAGATT 


GTACTGAGAG 


TGCACCATAT 


GCGGTGTGAA 




1951 


ATACCGCACA 


GATGCGTAAG 


GAGAAAATAC 


CGCATCAGGC 


GCTCTTCCGC 


45 


2001 


TTCCTCGCTC 


ACTGACTCGC 


TGCGCTCGGT 


CTGTCGGCTG 


CGGCGAGCGG 




2051 


TATCAGCTCA 


CTCAAAGGCG 


GTAATACGGT 


TATCCACAGA 


ATCAGGGGAT 




2101 


AACGCAGGAA 




AGCAAAAGGC 


CAGCAAAAGG 


CCAGGAACCG 




2151 


TAAAAAGGCC 


GCGTTGCTGG 


CGTTTTTCCA 


TAGGCTCCGC 


CCCCCTGACG 


50 


2201 


AGCATCACAA 


AAATCGACGC 


TCAAGTCAGA 


GGTGGCGAAA 


CCCGACAGGA 




2251 


CTATAAAGAT 


ACCAGGCGTT 


TCCCCCTGGA 


AGCTCCCTCG 


TGCGCTCTCC 
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2301 


TGTTCCGACC 


CTGCCGCTTA 


CCGGATACCT 


GTCCGCCTTT 


CTCCCTTCGG 




2351 


GAAGCGTGGC 


GCTTTCTCAA 


TGCTCACGCT 


GTAGGTATCT 


CAGTTCGGTG 


5 


2401 


TAGGTCGTTC 


GCTCCAAGCT 


GGGCTGTGTG 


CACGAACCCC 


CCGTTCAGCC 




2451 


CGACCGCTGC 


GCCTTATCCG 


GTAACTATCG 


TCTTGAGTCC 


AACCCGGTAA 




2501 


GACACGACTT 


ATCGCCACTG 


GCAGCAGCCA 


CTGGTAACAG 


GATTAGCAGA 




2551 


GCGAGGTATG 


TAGGCGGTGC 


TACAGAGTTC 


TTGAAGTGGT 


GGCCTAACTA 


10 


2601 


CGGCTACACT 


AGAAGGACAG 


TATTTGGTAT 


CTGCGCTCTG 


CTGAAGCCAG 




2651 


TTACCTTCGG 


AAAAAGAGTT 


GGTAGCTCTT 


GATCCGGCAA 


ACAAACCACC 




2701 


GCTGGTAGCG 


GTGGTTTTTT 


TGTTTGCAAG 


CAGCAGATTA 


CGCGCAGAAA 




2751 


AAAAGGATCT 


CAAGAAGATC 


CTTTGATCTT 


TTCTACGGGG 


TCTGACGCTC 


15 


2801 


AGTGGAACGA 


AAACTCACGT 


TAAGGGATTT 


TGGTCATGAG 


ATTATCAAAA 




2851 


AGGATCTTCA 


CCTAGATCCT 


TTTAAATTAA 


AAATGAAGTT 


TTAAATCAAT 




2901 


CTAAAGTATA 


TATGAGTAAA 


CTTGGTCTGA 


CAGTTACCAA 


TGCTTAATCA 


20 


2951 


GTGAGGCACC 


TATCTCAGCG 


ATCTGTCTAT 


TTCGTTCATC 


CATAGCTGCC 


3G01 


TGACTCCCCG 


TCGTGTAGAT 


AACTACGATA 


CGGGAGGGCT 


tACCATCTGG 




3051 


CCCCAGTGCT 


GCAATGATAC 


CGCGAGACCC 


ACGCTCACCG 


GCTCCAGATT 




3101 


TATCAGCAAT 


AAACCAGCCA 


GCCGGAAGGG 


CCGAGCGCAG 


AAGTGGTCCT 


25 


3151 


GCAACTTTAT 


CCGCCTCCAT 


CCAGTCTATT 


AATTGTTGCC 


GGGAAGCTAG 




3201 


AGTAAGTAGT 


TCGCCAGTTA 


ATAGTTTGCG 


CAACGTTGTT 


GCCATTGCTA 




3251 


CAGGCATCGT 


GGTGTCACGC 


TCGTCGTTTG 


GTATGGCTTC 


ATTCAGCTCC 




3301 


GGTTCCCAAC 


GATCAAGGCG 


AGTTACATGA 


TCCCCCATGT 


TGTGCAAAAA 


30 


3351 


AGCGGTTAGC 


TCCTTCGGTC 


CTCCGATCGT 


TGTCAGAAGT 


AAGTTGGCCG 




3401 


CAGTGTTATC 


ACTCATGGTT 


ATGGCAGCAC 


TGCATAATTC 


TCTTACTGTC 




3451 


ATGCCATCCG 


TAAGATGCTT 


TTCTGTGACT 


GGTGAGTACT 


CAACCAAGTC 




3501 


ATTCTGAGAA 


TAGTGTATGC 


GGCGACCGAG 


TTGCTCTTGC 


CCGGCGTCAA 


35 


3551 


TACGGGATAA 


TACCGCGCCA 


CATAGCAGAA 


CTTTAAAAGT 


GCTCATCATT 




3601 


GGAAAACGTT 


CTTCGGGGCG 


AAAACTCTCA 


AGGATCTTAC 


CGCTGTTGAG 




3651 


ATCCAGTTCG 


ATGTAACCCA 


CTCGTGCACC 


CAACTGATCT 


TCAGCATCTT 


40 


3701 


TTACTTTCAC 


CAGCGTTTCT 


GGGTGAGCAA 


AAACAGGAAG 


GCAAAATGCC 


3751 


GCAAAAAAGG 


GAATAAGGGC 


GACACGGAAA 


TGTTGAATAC 


TCATACTCTT 




3801 


CCTTTTTCAA 


TATTATTGAA 


GCATTTATCA 


GGGTTATTGT 


CTCATGAGCG 




3851 


GATACATATT 


TGAATGTATT 


TAGAAAAATA 


AACAAATAGG 


GGTTCCGCGC 


45 


3901 


ACATTTCCCC 


GAAAAGTGCC 


ACCTGACGTC 


TAAGAAACCA 


TTATTATCAT 




3951 


GACATTAACC 


TATAAAAATA 


GGCGTATCAC 


GAGGCCCTTT 


CGTCTTCAC 



50 

Tablelle 14: (Partielie) Nuldectidsequenz des humanen Semaphorin L Gens. 
(8888 Nukieotide) (SEQ ID NO.: 41): 



55 



EP 0 892 047 A2 



GAGCCGCACACGGTGCTTTTCCACGAGCCAGGCAGCTCCTCTGTGTGGGTGGGAGGACGT 

GGCAAGGTCTACCTCTTTGACTTCCCCGAGGGCAAGAACGCATCTGTGCGCACGGTGAGC 

CTCTCTCTTCCCCCAACACCCCCCCTACCCTCTTATCTCCCCTCTGGCCCTGCCAAGGGT 

CCTCAGGGAATCCGAGGGAGCTGGCTTCTCTTCCTAAACTGCCCCCACCTCCGTATCCTA 

TAAATGGCTCCTGGGGGAGGCTCCCTAAAGGTAGTCCAGATTGGAGTGGGGAGCTGGGGC 

GGTGTGGAGAAAAACAGGAGCTAATGGGCCTGGCCAGCTGGGCAGCGCTGCTGCGGAAAG 

CCCAGGCTGGAAGCTGGGCCCCAGAGCCCATGCCTGGTCTTCTGAACCCTCTGGGCCTCA 

GCTCTGGATATGAGACCCTGTTTGACCTCAGGTAGATCACTCACCCTCTCAGAGCCCCAG 

TTGCTCATCTGTCAGATGAGAATAATGGTTGCTTCCTTTGGGGCTTATCCTGAGGCTGTG 

TGGAAAGCATTTCAGGGGTACCTCACCCCTGGCAGATTGAACTAATGCTTCTCCCCTTCC 

CCAGGTGAATATCGGCTCCACAAAGGGGTCCTGTCTGGATAAGCGGGTGAGCGGGGGAGG 

GATCTGGAGGGGTCTGAGCCACTTGGTAAAGGGAGAGGAGACCCTGAGGGTCTAAGGAAG 

GAAGCATGGCCCTGCCCCACGAGTCCCAGACTGATGGGGAGACGTGGTCCTCTGTGCTTA 

GGGGATGGCGTCAGCTGCACACACTCTGGGCTGTCCCGGGAGGCTGTCACCTATGCTAAG 

CCCTTCTGACACCTTCTTCCCTGATCCTGGGGGTCCTAGTGCTAGGCTTGCCAGGGCCTT 

CCAGCAftCCAATTTCTCTCCTCCCTTCTCTCTTCCCCGGGCAGGACTGCGAGAACTACAT 

CACTCTCCTGGAGAGGCGGAGTGAGGGGCTGCTGGCCTGTGGCACCAACGCCCGGCACCC 

CAGCTGCTGGAACCTGGTGAGAAGGCTGCTCCCCATGTGCCTGATCAGCTCACCTTCTAC 

TGCGTGGGCTTCTGCCCCTCATGGTGGGAAGGAGATGGCGAGACTCCAATGCTGGCCTTG 

CCCTGGGAGGATGGGGCTCCTGGCCGAGAAACTGGCCGTCATGGGAGGCAGTGGCTGTGG 

GATTATGTGGCCATCCAACCCTCTGGATCTCCCACAGGTGAATGGCACTGTGGTGCCACT 

TGGCGAGATGAGAGGCTACGCCCCCTTCAGCCCGGACGAGAACTCCCTGGTTCTGTTTGA 

AGGTTGGGGCATGCTTCGGAACTGGGCTGGGAGCAGGATGGTCAGCTCTTTGTCCAGTGT 

CCGGAGGAGGGACTTCCAGGAGCTGCCTGCCCTTACTCATTTCTCCCTCCCACTGACCCC 

AGGGGACGAGGTGTATTCCACCATCCGGAAGCAGGAATACAATGGGAAGATCCCTCGGTT 

CCGCCGCATCCGGGGCGAGAGTGAGCTGTACACCAGTGATACTGTCATGCAGAGTGAGTC 

AGGCTCCGGCTGGGCTGAGGGTGGGCAAGGGGGTGTGAGCACTTAAGGTGGCAGATGGGA 

TCCTGATGTTTCTGGGAGGGCTCCCTGAGGGCCGCTGGGGCCATGCAGGAAAGCAGGACC 

TTGGTATAGGCCTGAGAAGTTAGGGTTGGCTGGGAGCAGAGGAACAGACAAGGTATAGCA 

GTGGGATGGGCCCAGCCCTCTTCAGGAACACAAACAGAGGGAGCCCCAGACCCAGTGCAG 

GGTCCCCAGGAGCCAAAGTTTATCCTCTGCTGAGTTCACGTGGAGGCAGCCCCCCAACTC 

CCTCCTCATCAGGGCTCTGCCAATTGAGCAGAAGTGACATAGGGGCCCCCAGGGACCTTC 

CCCCACTCCCCAGGCATGAAGTCATTGCTCCTGGGCCGATGACATCTTTGTAGGAAGAGG 

GCAAAACAGGTGTGGGGTGGAGGTGCAGGGTCTAGGGCCCCTCGGGGAGTTGGACCTGAT 

GTTATGAGTCCTATTCCAGATCTGATTTGCCATGGTTTGTGCAGACCCGAAGGAGGGAGG 

AGAGTGTGCAGGGTTGGAATGGTCTCCCGGGCAAGCTTCCCAGCCTTACGCCCATTCGCT 

TCTGTGCCCTGGCAGACCCACAGTTCATCAAAGCCACCATCGTGCACCAAGACCAGGCTT 

ACGATGACAAGATCTACTACTTCTTCCGAGAGGACAATCCTGACAAGAATCCTGAGGCTC 

CTCTCAATGTGTCCCGTGTGGCCCAGTTGTGCAGGGTGAACACGGGCGTGAGGGCTGCTG 
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GCTACGTGTCTGTGCATGAATAGGCCTGAGTGAGGGTGAGTTCTGTGTGTCCGTGTGCAT 

GTAGAAGTTGTGTGGATGTATGAGTGGGTCTGTGTCAGGGACTGTGGGAGCAGCTGTGTG 

TGCATGGAGCATCATGTGTCTGTGTGTGGGTAAAGGTGGCTGAGCTCCTGTGCACGTATG 

ATGGCGTGTGAGCGTGTGTATGATGGGGTGTGTGTGTGTGTGTGTGTGTGTGTTTTGCCT 

GTGTGAATGTGCTGTGCCACGTATGTGGGTGCGTGAGTCAGTAAATGTGTGTCTGAGTCC 

GTCTGCTCTGTGGGGACCTGGCACTeTCACCTGCCeTGACCCTGGGCACTGCTGGCCCTG 

GGCTCTGGATCAGCCAGGCCTGCTTGCAGGAGTCTCATCTGGAGACCTGCCCTGAGTCCT 

GGGGCACCCCCGGCAGGTCCTGGCCCCTCGCAGCCTGCCTTCCTCCTCTGGGCCCAGGTG 

TTGATATTGCTGGCAGTGGTTTCCTGGGGTGTGTGGGGAAGCCCGGGCAGGTGCTGAGGG 

GCCTCTTCTCCCCTCTACCCTTCCAGGGGGACCAGGGTGGGGAAAGTTCACTGTCAGTCT 

CCAAGTGGAACACTTTTCTGAAAGCCATGCTGGTATGCAGTGATGCTGCCACCAACAAGA 

ACTTCAACAGGCTGCAAGACGTCTTCCTGCTCCCTGACCCCAGCGGCCAGTGGAGGGACA 

CCAGGGTCTATGGTGTTTTCTCCAACCCCTGGTGAGTGGCCCTTGTCCTGGGGCCGGGGC 

TGGCATTGGTTCAGTGTCCAGTAGGGACAGGAGGCCTTGGGCCCTGCTGAGGGCCTCCCT 

GGTGTGGCAGGAGCAGGGGCTGCAGGCTCAAGAGGCTGGGCTGTTGCTGGGTGTGGGGTG 

GGGGGACAGCCAGTGCGATGTATGTACTGTTGTGTGAGTGAGTCTGCACTCATGGGTGTG 

TGTGCATGCCCTATATGCACACTCATGACTGCACTTGTGCCTGTGTGTCCCACCACCTGC 

TTGTGCCGAGAGTGGACACTGGGCCCAGGAGGAAGCTGCTGAAGCATCTCTCGGGGAGCT 

GGGTGCTATTACACCTGCTCAGGCACTGCCTGAGCCCGATAATTCACACTTCTTAATCAC 

TCTCATTGATTGAACACACGGCAGGCGGAAGTGTTGGGTGTGTGTGGGGAGAGTTAGGGA 

TAGAGTGGAGGAAGCCAAGACCCTGCTCTGTGGCTCCTGGGTGAGTGGGTCCCCCAGGCT 

GGGAAGGGGTTGGGGGTCTGGCCTCCTGGGGCATCAGCACCCCACAGCCTGTGCCCAGGG 

AGGGCTAGAGAACTGCTCAGCCTATGATGGGGTTCCTCCTGCCTTGGGGTTGGGTAGAGC 

AGATGGCCTCTAGACTCAGTGATTCTGTAACAGGATACAAGTTTGTGGTTTTAAATTGCA 

GCACAAAGAAATTAGGCTGAACTCCTCTCCTTCCTCCTCTCCATCCCTCCCCATTTTCAG 

TGGTGGTTGGCAACTCAGTGCCAGGCACAAGGCTGGCCTGGGTGAGTGGAGGTGGATGGG 

TGGGTTCTGGGCCCCCCATTGAGCTGGTCTCCATGTCACTGCAGGAACTACTCAGCCGTC 

TGTGTGTATTCCCTCGGTGACATTGACAAGGTCTTCCGTACCTCCTCACTCAAGGGCTAC 

CACTCAAGCCTTCCCAACCCGCGGCCTGGCAAGGTGAGCGTGACACCAGCCGTGGCCCAG 

GCCCAGCCCTCCTTCTGCCTCACCTCCCACCACCCCACTGACCTGGGCCTGCTCTCCTTG 

CCCAGTGCCTCCCAGACCAGCAGCCGATACCCACAGAGACCTTCCAGGTGGCTGACCGTC 

ACCCAGAGGTGGCGCAGAGGGTGGAGCCCATGGGGCCTCTGAAGACGCCATTGTTCCACT 

CTAAATACCACTACCAGAAAGTGGCCGTCCACCGCATGCAAGCCAGCCACGGGGAGACCT 

TTCATGTGCTTTACCTAACTACAGGTGAGAGGCTACCCCGGGACCCTCAGTTTGCTTTGT 

AAAAACGGGCATGAAAGGTGTAAGGAATAATGTAGTTAACATCTGGTTGGATCTTTACAT 

GTGGAAGGAATAATTGAGTGACTGGAGTTGTCAGGGGTTAATGTGTGTGGGTGTGGAAGA 

GCCAGGCAGGGAGAGCTTCCTGGAGGAGGTAGGGGCAAGAGGGAAAGGGGGATGGGAGAA 

AAGCAAGCACTGGGATTTGGAGGCGGAAATCTGGAGAGTCTGAGCAAAGCCAGGTGCACC 

TTTGGTCCAGATGTCTGACTCAGGGAAGAAGATGGTAGGAAGAGACGTGGCAAATGAGGA 
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GGAGGGGCCTGAACCACAGGGATACTGGCCTCTGCCAGGCAGAATGAGGGAGTCAGGCCC 

TGCGCCTGTCTTTGGGATTGTGCAGGTGAGAAGAAACATTTGAGGAGTTGATGGGGCACA 

AATTAGGTATGGGGAAGGAGTTCCAGGGGGCAGAACCTTTGCCATCTCACAGAGGACAGG 

GGCAGCTTCTCTTCTTCCCTGGAGTAGGCCCTGCTGGGGGAAGCTGGGTGGAATGCCGTG 

GGAGATGCTCCTGCTTTCTGGAAAGCCACAGGACACGGAGGAGCCAGTCCTGAGTTGGGT 

TTGTCGCAGCTTCCCATGCCAGCTGCCTTCCTTGAGACTGGAAAGGGCCTCTAGCACCCC 

TGGGGCCATTCAATTCAGGCCCAGGCGCCCAACCTCAGTTGTTCACATTCCCCATGTGAT 

CTCCTGTTGCTGCTTCACCTTGGGACTGTCTCGGCTTTGGTGACCTTGTAGGAAACTGGA 

ACCCCAGCACCATTGTTTGGCTCCTGGAAGCCTTGGGGAGAGGAATTTCCCACAGGGCAG 

GGCCTGGGTCCTGATTCCCTGCCTCTTTACTCCCTATTCATCCCGGCTACACCCTTGGGC 

CCCCATCCTTGCTTGGCTCCAGTACTGGCTGGCACAGCTGTTGTGGTCATCCAGGGATGG 

CAGGGCACTGGGGAACAGAAGAGAGAGGTCACACAGTGCGGAACTGGGAGCAGGAGCTAG 

GACAAGGAAGGCTGGACTTGGGCCATGGATTCCCTTCCTGCAGACTTGGGAAGTGAGCAC 

ACTTGAGTGATTAGAGAAGGTGTCTTCGTTCTAAGGGCAGTGGAGGAGGCACCATTTTGG 

AGCCTGCATCATTCGTATTTGGGCTAGATTGAAAAATAGAGCTTTCTAAGTCCTCTGCAG 

AGAATSGGAGGC7CTCACAACTGGGAGAAGTATTGGCTCTTTTCCTGAGAATTTTGCCAA 

GGGTATG'CTGTTACTGGGGCTGGTTTGGAAGGAGTATAGGGCATTATGTCTGTGAAGGCA 

GTGGCTGGGGTGGGGCCTTATCAGGCCCAAGGAGCATCTGGCCACATCTCAGAGTCCACA 

GATGAGGATCACGGATGTGTAGAGGAAACATCCTAGGCAGGCAATCATCTGACTGCTTTT 

TTGGGGCAGGTGATGCCCTGGGAAATTGGGAGGGAGGGAGAGAGGGAGGTAGGCTATTCT 

AGAAACTGGGAGAGCAGGTGAGGTAGGATTGGGAGGACCAGGGGTCAGGGTCCCCATTGG 

TCCCTAATTGAGAACGGAGAGAGCATTGGTCTAGGAGGCAGGCAGCTCGGTTATAAGACC 

TTGGGAACTCTTGATTTAGAATCCAAGATCCTTTTTAGATCTAGGATTTTATAAAATTAA 

GATATCCCCTAAGATCAAATGCAACGTGGAGTCCTGAATTGGATCCTAGAACAGAAGAAG 

GACATTTGTGGAAAAACTAGTGAAATCCAAATAAAGTCTGTAGTTTTGTTAATAGTAATG 

CACCAATGTCAGTTGCCTAGTTGTGACAAATATACCGTGGTTATGTAAGATGGTAACATT 

AGGGGGAACTGGAGAAGGGTAGATTGGAGCTCTCTGTACTATCTTTGCAACTTTTCTGGG 

AATCTAAAATTACTCCAAAATAAAAAAAAAATGTATTTAAAGTAAATATATTCCCTAAGA 

GTCCAGGAGGCAGGGGAGTTGTAGAAGCAGCTGAGTGGTTGGGTTCTGACAGATTTGGTT 

CCAACTCGGTCTCTGCTGCTCACCAGCTGTGTGACCTTGAGCAAGTGGCTTAGCCTTTCT 

GAGCCTGATTTCCTTATCTGTGGAGTGGGGAAGATGACAGCCACCTCGCAGGGCTGTGGA 

GGGTTAAACGAGGTGATGCATGGACAGCAGCCGCACTGACCTTGCTGGTGTGGGGCTCCT 

GCTTCTGTTCTTCCCGTGCAGCCTTGGGAATGTTGGAGGCCGTATCCAGGGACCCCTGGG 

CCTCCTGGGATGGCCTCTCTGGATCAGCCTTGGAAGGTTCCAGGCTGCCCTTAGGCTCCC 

ACATTCTTCCCCAGTCACGCTCTCCTCGCCCTGCCCACACCAGTCCTGTGACCCTTGCCT 

GAGTTGTGACTTCCCACCCCTCCCCGGCCTAGAGGAAAGCTGCCTGGCCCCTCAGTGGGA 

CTCCCGCCCACTGACCCTCTGTCCACCATACACAGACAGGGGCACTATCCACAAGGTGGT 

GGAACCGGGGGAGCAGGAGCACAGCTTCGCCTTCAACATCATGGAGATCCAGCCCTTCCG 

CCGCGCGGCTGCCATCCAGACCATGTCGCTGGATGCTGAGCGGGTGAGCCTTCCCCCACT 
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GCGTCCCATGGGCTATGCAGTGACTGCAGCTGAGGACAGGGCTCCTTTGCATGTGATTTG 

TGTGTTCTTTTAAGAGCTTCTAGGCCTTAGGGCCTGGACATTTAGGACTGAGTGTGGGGT 

GGGGCCCGGGCCTGACCCAATCCTGCTGTCCTTCCAGAGGAAGCTGTATGTGAGCTCCCA 

GTGGGAGGTGAGCCAGGTGCCCCTGGACCTGTGTGAGGTCTATGGCGGGGGCTGCCACGG 

TTGCCTCATGTCCCGAGACCCCTACTGCGGCTGGGACCAGGGCCGCTGCATCTCCATCTA 

CAGCTCCGAACGGTACGTTGGCCGGGATCCCTCCGTCCCTGGGACAAGGTGGGCATGGGA 

CAGGGGGAGGTGTTGTCGGGCTGGAAGAGGTGGCGGTACTGGGCCTTTCTTGTGGGACCT 

CCTCTCTACTGGAACTGCACTAGGGGTAAGGATATGAGGGTCAGGTCTGCAGCCTTGTAT 

CTGCTGATCCTCTTTCGTCCTTCCCACTCCAGGTCAGTGCTGCAATCCATTAATCCAGCC 

GAGCCACACAAGGAGTGTCCCAACCCCAAACCAGGTACCTGATCTGGCCCTGCTGGCGGC 

TGTGGCCCAATGAGTGGGGTACTGCCCTGCCCTGATTGTCCTGGTCTGAGGGAAACATGG 

CCTTGTCCTGTGGGCCCCAGGTACATGGGGCAGGATACAGTCCTGCAGAGGGAGCCCTCT 

TGGTGGGATGAGCGAGACGGGAGAAAAAAGGAGGACGCTGAGGGCTGGGTTCCCCACGTT 

CATTCAGAAGCCTTGTCCTGGGATCCCAGTCGGTGGGGAGGACACATCCTCCCCTGGGAG 

CTCTTTGTCCCTCCTCACGGCTGCTTCCCCACTGCCTCCCCAGACAAGGCCCCACTGCAG 

AAGGTTTCCC7GGCu*-u>^>^^- 1 ci l-vjc i/n- TACCTGAGCTGCCCCATGGAATCCCGCCAC 

GCCACCTACTCATGGCGCCACAAGGAGAACGTGGAGCAGAGCTGCGAACCTGGTCACCAG 

AGCCCCAACTGCATCCTGTTCATCGAGAACCTCACGGCGCAGCAGTACGGCCACTACTTC 

TGCGAGGCCCAGGAGGGCTCCTACTTCCGCGAGGCTCAGCACTGGCAGCTGCTGCCCGAG 

GACGGCATCATGGCCGAGCACCTGCTGGGTCATGCCTGTGCCCTGGCCGCCTCCCTCTGG 

CTGGGGGTGCTGCCCACACTCACTCTTGGCTTGCTGGTCCACTAGGGCCTCCCGAGGCTG 

GGCATGCCTCAGGCTTCTGCAGCCCAGGGCACTAGAACGTCTCACACTCAGAGCCGGCTG 

GCCCGGGAGCTCCTTGCCTGCCACTTCTTCCAGGGGACAGAATAACCCAGTGGAGGATGC 

CAGGCCTGGAGACGTCCAGCCGCAGGCGGCTGCTGGGCCCCAGGTGGCGCACGGATGGTG 

AGGGGCTGAGAATGAGGGCACCGACTGTGAAGCTGGGGCATCGATGACCCAAGACTTTAT 

CTTCTGGAAAATATTTTTCAGACTCCTCAAACTTGACTAAATGCAGCGATGCTCCCAGCC 

CAAGAGCCCATGGGTCGGGGAGTGGGTTTGGATAGGAGAGCTGGGACTCCATCTCGACCC 

TGGGGCTGAGGCCTGAGTCCTTCTGGACTCTTGGTACCCACATTGCCTCCTTCCCCTCCC 

TCTCTCATGGCTGGGTGGCTGGTGTTCCTGAAGACCCAGGGCTACCCTCTGTCCAGCCCT 

GTCCTCTGCAGCTCCCTCTCTGGTCCTGGGTCCCACAGGACAGCCGCCTTGCATGTTTAT 

TGAAGGATGTTTGCTTTCCGGACGGAAGGACGGAAAAAGCTCTGAAAAAAAAAAAAAAAA 

AAAAAAAA 

Tabelle 15: Nukleolidsequenz von pMelBacA-HSEMAL (6622bp) (SEQ ID NO: 42) 

1 GATATCATGG AGATAATTAA AATGATAACC ATCTCGCAAA TAAATAAGTA 

□ 

□ 

51 TTTTACTGTT TTCGTAACAG TTTTGTAATA AAAAAACCTA TAAATATGAA 
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101 


ATTCTTAGTC 


AACGTTGCCC 


TTGTTTTTAT 


GGTCGTATAC 


ATTTCTTACA 


5 


151 


TCTATGCGGA 


TCGATGG 

gga 


tccgcccagg 


gccacctaag 


gagcggaccc 






cgca tc t teg 


ccgtctggaa 


aggccatgta 


gggcaggacc 


gggtggactt 




cO L 


tggccagact 


gagccgcaca 


cggtgctttt 


ccacgagcca 


ggcagctcct 


W 


301 


ctgtgtgggt 


gggaggacgt 


ggcaaggtct 


acctctttga 


cttccccgag 




TCI 

351 


ggcaagaacg 


catctgtgcg 


cacggtgaat 


atcggctcca 


caaaggggtc 




^Ul 


ctgtctggat 


aagcgggact 


gcgagaacta 


catcactctc 


ctggagaggc 


15 


4o 1 


ggagtgaggg 


gctgctggcc 


tgtggcacca 


acgcccggca 


ccccagctgc 




OU 1 


tggaacctgg 


tgaatggcac 


tgtggtgcca 


cttggcgaga 


tgagaggcta 


20 


bo i 


tgcccccttc 


agcccggacg 


agaactccct 


ggttctgttt 


gaaggggacg 


601 


aggtgtattc 


caccatccgg 


aagcaggaat 


acaatgggaa 


gatccctcgg 




ob 1 


ttccgccgca 


tccggggcga 


gagtgagctg 


tacaccagtg 


atactgtcat 


25 


/ Ul 


gcagaaccca 


cagttcatca 


aagccaccat 


cgtgcaccaa 


gaccaggctt 


751 


acgatgacaa 


gatctactac 


ttcttccgag 


aggacaatcc 


tgacaagaat 




801 


cctgaggctc 


ctctcaatgt 


gtcccgtgtg 


gcccagttgt 


gcagggggga 


30 


851 


ccagggtggg 


gaaagttcac 


tgtcagtctc 


caagtggaac 


acttttctga 




901 


aagccatgct 


ggtatgcagt 


gatgctgcca 


ccaacaagaa cttcaacagg 




OCT 

951 


ctgcaagacg 


tcttcctgct 


ccctgacccc 


agcggccagt 


ggagggacac 


35 


iUU 1 


cagggtctat 


ggtgttttct 


ccaacccctg gaactactca gccgtctgtg 




1051 


tgtattccct 


cggtgacatt 


gacaaggtct 


tccgtacctc ctcactcaag 




1101 


ggctaccact 


caagccttcc 


caacccgcgg 


cctggcaagt 


gcctcccaga 


40 


1151 


ccagcagccg 


atacccacag 


agaccttcca 


ggtggctgac 


cgtcacccag 




1201 


aggtggcgca 


gagggtggag 


cccatggggc 


ctctgaagac 


gccattgttc 




1 O C 1 

1251 


cactctaaat 


accactacca 


gaaagtggcc 


gttcaccgca 


tgcaagccag 


45 




ccacggggag 


acctttcatg 


tgctttacct 


aactacagac 


aggggcacta 




lib 1 


tccacaaggt 


ggtggaaccg 


ggggagcagg 


agcacagctt 


cgccttcaac 




1401 


atcatggaga 


tccagccctt 


ccgccgcgcg 


gctgccatcc 


agaccatgtc 


50 


1451 


gctggatgct 


gagcggagga 


agctgtatgt 


gagctcccag 


tgggaggtga 




1501 


gccaggtgcc 


cctggacctg 


tgtgaggtct 


atggcggggg 


ctgccacggt 



55 
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10 



15 



20 



25 



30 



35 



40 



1551 tgcctcatgt cccgagaccc ctactgcggc tgggaccagg gccgctgcat 

1601 ctccatctac agctccgaac ggtcagtgct gcaatccatt aatccagccg 

1651 agccacacaa ggagtgtccc aaccccaaac cagacaaggc cccactgcag 

1701 aaggtttccc tggccccaaa ctctcgctac tacctgagct gccccatgga 

1751 atcccgccac gccacctact catggcgcca caaggagaac gtggagcaga 

1801 gctgcgaacc tggtcaccag agccccaact gcatcctgtt catcgagaac 

1851 ctcacggcgc agcagtacgg ccactacttc tgcgaggccc aggagggctc 

1901 ctacttccgc gaggctcagc actggcagct gctgcccgag gacggcatca 

1951 tggccgagca cctgctgggt catgcctgtg ccctggctgc ctgaattc 



GA 

2001 AGCTTGGAGT CGACTCTGCT GAAGAGGAGG AAATTCTCCT TGAAGTTTCC 

2051 CTGGTGTTCA AAGTAAAGGA GTTTGCACCA GACGCACCTC TGTTCACTGG 

2101 TCCGGCGTAT TAAAACACGA TACATTGTTA TTAGTACATT TATTAAGCGC 

2151 TAGATTCTGT GCGTTGTTGA TTTACAGACA ATTGTTGTAC GTATTTTAAT 

2201 AATTCATTAA ATTTATAATC TTTAGGGTGG TATGTTAGAG CGAAAATCAA 

22 51 ATGATTTTCA GCGTCTTTAT ATCTGAATTT AAATATTAAA TCCTCAATAG 

2 301 ATTTGTAAAA TAGGTTTCGA TTAGTTTCAA ACAAGGGTTG TTTTTCCGAA 

2351 CCGATGGCTG GACTATCTAA TGGATTTTCG CTCAACGCCA CAAAACTTGC 

2 4 01 CAAATCTTGT AGCAGCAATC TAGCTTTGTC GATATTCGTT TGTGTTTTGT 

2 451 TTTGTAATAA AGGTTCGACG TCGTTCAAAA TATTATGCGC TTTTGTATTT 

2 501 CTTTCATCAC TGTCGTTAGT GTACAATTGA CTCGACGTAA ACACGTTAAA 

2551 TAAAGCCTGG ACATATTTAA CATCGGGCGT GTTAGCTTTA TTAGGCCGAT 

2 601 TATCGTCGTC GTCCCAACCC TCGTCGTTAG AAGTTGCTTC CGAAGACGAT 

2 651 TTTGCCATAG CCACACGACG CCTATTAATT GTGTCGGCTA ACACGTCCGC 

27 01 GATCAAATTT GTAGTTGAGC TTTTTGGAAT TATTTCTGAT TGCGGGCGTT 
45 27 51 TTTGGGCGGG TTTCAATCTA ACTGTGCCCG ATTTTAATTC AGACAACACG 

28 01 TTAGAAAGCG ATGGTGCAGG CGGTGGTAAC ATTTCAGACG GCAAATCTAC 
2 8 51 TAATGGCGGC GGTGGTGGAG CTGATGATAA ATCTACCATC GGTGGAGGCG 
2 901 CAGGCGGGGC TGGCGGCGGA GGCGGAGGCG GAGGTGGTGG CGGTGATGCA 
2 951 GACGGCGGTT TAGGCTCAAA TTGTCTCTTT CAGGCAACAC AGTCGGCACC 
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5 



10 



20 



35 



45 



50 



3001 


TCAACTATTG 


TACTGGTTTC 


GGGCGTATGG 


TGCACTCTCA 


GTACAATCTG 


3051 


CTCTGATGCC 


GCATAGTTAA 


GCCAGCCCCG ACACCCGCCA ACACCCGCTG 


3101 


ACGCGCCCTG 


ACGGGCTTGT 


CTGCTCCCGG 


CATCCGCTTA 


PAnAPa Ar^T 


3151 


GTGACCGTCT 


CCGGGAGCTG 


CATGTGTCAG 


AGGTTTTCAC 


^ vj X X 


3201 


GAAACGCGCG 


AGACGAAAGG 


GCCTCGTGAT 


ACGCCTATTT 


TTATAGGTTA 


3251 


ATGTCATGAT 


AATAATGGTT 


TCTTAGACGT 


CAGGTGGCAC 


TTTTCGGGGA 


3301 


AATGTGCGCG 


GAACCCCTAT 


TTGTTTATTT 


TTCTAAATAC 


ATTCAAATAT 


3351 


GTATCCGCTC 


ATGAGACAAT 


AACCCTGATA 


AATGCTTCAA 


TAATATTGAA 


3401 


AAAGGAAGAG 


TATGAGTATT 


CAACATTTCC 


GTGTCGCCCT 


TATTPPPTTT 


3451 


TTTGCGGCAT 


TTTGCCTTCr 


TGTTTTTGCT 


CACCCAGAAA 


CGCTGGTGAA 


3501 


AGTAAAAGAT 


GCTGAAGATC 


AGTTGGGTGC 


ACGAGTGGGT 


TACATCGAAC 


3551 


TGGATCTCAA 


CAGCGGTAAG 


ATCCTTGAGA 


GTTTTCGCCC 


CGAAGAACGT 


3601 


TTTCCAATGA 


TGAGCACTTT 


TAAAGTTCTG 


CTATGTGGCG 


CGGTATTATC 


3651 


CCGTATTGAC 


GCCGGGCAAG 


AGCAACTCGG 


TCGCCGCATA 


C AC TAT TP T C 

V'lw X X\ X X w X ^>tf 


3701 


AGAATGACTT 


GGTTGAGTAC 


TCACCAGTCA 


CAGAAAAGCA 


X V- X lAV^kJoAl 


3751 


GGCATGACAG 


TAAGAGAATT 


ATGCAGTGCT 


GCCATAACCA 


X urVVj X oA 1 i\A 


3801 


CACTGCGGCr 


rtrtv^ X X X X 


TGACAACGAT 


CGGAGGACCG 


JkJn cuzjifzr'T'h'h. 

/uiovt/iuv,. X An 


3851 


CCGCTTTTTT 


GCACAACATr; 


GGGGATCATG 


TAACTCGCCT 


TGATCGTTGf^ 

X wXl X w w X X, wVJ 


3901 


GAACCGGAGC 


TGAATGAAGC 


CATACCAAAC 


GACGAGCGTG 


ACACCACGAT 


3951 


GCCTGTAGCA 


ATGGCAACAA 


CGTTGCGCAA 


ACTATTAACT 


GGCGAACTAC 


4001 


TTACTCTAGC 


TTCCCGGCAA 


CAATTAATAG 


ACTGGATGGA 


GGCGGATAAA 


4051 


GTTGCAGGAC 


CACTTCTGCG 


CTCGGCCCTT 


CCGGCTGGCT 


GGTTTATTGC 


4101 


TGATAAATCT 


GGAGCCGGTG 


AGCGTGGGTC 


TCGCGGTATC 


ATTGCAGCAC 


4151 


TGGGGCCAGA 


TGGTAAGCCC 


TCCCGTATCG 


TAGTTATCTA 


CACGACGGGG 


4201 


AGTCAGGCAA 


CTATGGATGA 


ACGAAATAGA 


CAGATCGCTG 


AGATAGGTGC 


4251 


CTCACTGATT 


AAGCATTGGT 


AAu i b rC AG A 


CCAAGTTTAC 


TCATATATAC 


4301 


TTTAGATTGA 


TTTAAAACTT 


CATTTTTAAT 


TTAAAAGGAT 


CTAGGTGAAG 


J 0 i 


ATCCTTTTTG 


ATAATCTCAT 


GACCAAAATC 


CCTTAACGTG 


AGTTTTCGTT 


4401 


CCACTGAGCG 


TCAGACCCCG 


TAGAAAAGAT 


CAAAGGATCT 


TCTTGAGATC 


4451 


CTTTTTTTCT 


GCGCGTAATC 


TGCTGCTTGC 


AAACAAAAAA 


ACCACCGCTA 
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4501 CCAGCGGTGG TTTGTTTGCC GGATCAAGAG CTACCAACTC TTTTTCCGAA 

4551 GGTAACTGGC TTCAGCAGAG CGCAGATACC AAATACTGTT CTTCTAGTGT 

4 601 AGCCGTAGTT AGGCCACCAC TTCAAGAACT CTGTAGCACC GCCTACATAC 

4 651 CTCGCTCTGC TAATCCTGTT ACCAGTGGCT GCTGCCAGTG GCGATAAGTC 

4 7 01 GTGTCTTACC GGGTTGGACT CAAGACGATA GTTACCGGAT AAGGCGCAGC 

4751 GGTCGGGCTG AACGGGGGGT TCGTGCACAC AGCCCAGCTT GGAGCGAACG 

4801 ACCTACACCG AACTGAGATA CCTACAGCGT GAGCTATGAG AAAGCGCCAC 

4 851 GCTTCCCGAA GGGAGAAAGG CGGACAGGTA TCCGGTAAGC GGCAGGGTCG 

4 901 GAACAGGAGA GCGCACGAGG GAGCTTCCAG GGGGAAACGC CTGGTATCTT 

4 951 TATAGTCCTG TCGGGTTTCG CCACCTCTGA CTTGAGCGTC GATTTTTGTG 
5001 ATGCTCGTCA GGGGGGCGGA GCCTATGGAA AAACGCCAGC AACGCGGCCT 
5051 TTTTACGGTT CCTGGCCTTT TGCTGGCCTT TTGCTCACAT GTTCTTTCCT 
5101 GCGTTATCCC CTGATTCTGT GGATAACCGT ATTACCGCCT TTGAGTGAGC 
5151 TGATACCGCT CGCCGCAGCC GAACGACCGA GCGCAGCGAG TCAGTGAGCG 
5201 AGGAAGCATC CTGCACCATC GTCTGCTCAT CCATGACGTG ACCATGCAGA 
52 51 GGATGATGCT CGTGACGGTT AACGCCTCGA ATCAGCAACG GCTTGCCGTT 
5301 CAGCAGCAGC AGACCATTTT nCAATCCGCAC CTCGCGGAAA CCGACATCGC 

5 351 AGGCTTCTGC TTCAATCAGC GTGCCGTCGG CGGTGTGCAG TTCAACCACC 
5401 GCACGATAGA GATTCGGGAT TTCGGCGCTC CACAGTTTCG GGTTTTCGAC 
5451 GTTCAGACGT AGTGTGACGC GATCGGTATA ACCACCACGC TCATCGATAA 
5501 TTTCACCGCC GAAAGGCGCG GTGCCGCTGG CGACCTGCGT TTCACCCTGC 
5551 CATAAAGAAA CTGTTACCCG TAGGTAGTCA CGCAACTCGC CGCACATCTG 
5 601 AACTTCAGCC TCCAGTACAG CGCGGCTGAA ATCATCATTA AAGCGAGTGG 
5651 CAACATGGAA ATCGCTGATT TGTGTAGTCG GTTTATGCAG CAACGAGACG 
57 01 TCACGGAAAA TGCCGCTCAT CCGCCACATA TCCTGATCTT CCAGATAACT 
57 51 GCCGTCACTC CAACGCAGCA CCATCACCGC GAGGCGGTTT TCTCCGGCGC 
5801 GTAAAAATGC GCTCAGGTCA AATTCAGACG GCAAACGACT GTCCTGGCCG 
5851 TAACCGACCC AGCGCCCGTT GCACCACAGA TGAAACGCCG AGTTAACGCC 
5901 ATCAAAAATA ATTCGCGTCT GGCCTTCCTG TAGCCAGCTT TCATCAACAT 
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5951 


TAAATGTGAG 


CGAGTAACAA 


CCCGTCGGAT 


TCTCCGTGGG 


AACAAACGGC 


6001 


GGATTGACCG 


TAATGGGATA 


GGTCACGTTG 


GTGTAGATGG 


GCGCATCGTA 


6051 


ACCGTGCATC 


TGCCAGTTTG 


AGGGGACGAC 


GACAGTATCG 


GCCTCAGGAA 


6101 


GATCGCACTC 


CAGCCAGCTT 


TCCGGCACCG 


CTTCTGGTGC 


CGGAAACCAG 


6151 


GCAAAGCGCC 


ATTCGCCATT 


CAGGCTGCGC 


AACTGTTGGG 


AAGGGCGATC 


6201 


GGTGCGGGCC 


TCTTCGCTAT 


TACGCCAGCT 


GGCGAAAGGG 


GGATGTGCTG 


6251 


CAAGGCGATT 


AAGTTGGGTA 


ACGCCAGGGT 


TTTCCCAGTC 


ACGACGTTGT 


6301 


AAAACGACGG 


GATCTATCAT 


TTTTAGCAGT 


GATTCTAATT 


GCAGCTGCTC 


6351 


TTTGATACAA 


CTAATTTTAC 


GACGACGATG 


CGAGCTTTTA 


TTCAACCGAG 


6401 


CGTGCATGTT 


TGCAATCGTG 


CAAGCGTTAT 


CAATTTTTCA 


TTATCGTATT 


6451 


GTTGCACATC 


AACAGGCTGG 


ACACCACGTT 


GAACTCGCCG 


CAGTTTTGCG 


6501 




recede c^c^ 




AAL ITICCGA 


CATTCTGTTG 


6551 


CCTACGAACG 


ATTGATTCTT 


TGTCCATTGA 


TCGAAGCGAG 


TGCCTTCGAC 


6601 


TTTTTCGTGT 


CCAGTGTGGC 


TT 
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SEQUENZPROTOKOLL 



(1) ALLGEMEINE INFORMATION: 

(i) ANMELDER: 

(A) NAME: Hoechst Marion Roussel Deutschland GmbH 

(B) STRASSE: - 

(C) ORT: Frankfurt 

(D) BUNDESLAKD : - 

(E) LAND: Deutachland 

(F) POSTLEITZAHL: 65926 

(G) TELEPHON: 069-305-7072 

(H) TELEFAX: 069-35-7175 
15 (I) TELEX: - 



10 



(ii) ANMELDETITEL : Humanes Semaphorin L (H-Sema-L) und 
korrespondierende Semaphorine in anderen Spezies 



(iii) ANZAHL DER SEQUENZEN: 44 

(iv) COMPUTER -LESBARE FORM: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: Patentin Release #1.0, Version #1.25 (EPA) 



(2) INFORMATION ZU SEQ ID NO: 1: 



30 ii) SEQUENZ CHARAKTERISTIKA : 

(A) LANGE: 2636 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

35 

(ii) ART DBS MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .2636 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 

45 CGGGGCCACG GGATGACGCC TCCTCCGCCC GGACGTGCCG CCCCCAGCGC ACCGCGCGCC 60 

CGCGTCCCTG GCCCGCCGGC TCGGTTGGGG CTTCCGCTGC GGCTGCGGCT GCTGCTGCTG 120 

CTCTGGGCGG CCGCCGCCTC CGCCCAGGGC CACCTAAGGA GCGGACCCCG CATCTTCGCC 180 

50 

GTCTGGAAAG GCCATGTAGG GCAGGACCGG GTGGACTTTG GCCAGACTGA GCCGCACACG 240 

GTGCTTTTCC ACGAGCCAGG CAGCTCCTCT GTGTGGGTGG GAGGACGTGG CAAGGTCTAC 3 00 
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CTCTTTGACT 


TCCCCGAGGG 


CAAGAACGCA 


TCTGTGCGCA 


CGGTGAATAT 


CGGCTCCACA 


360 




AAGGGGTCCT 


GTCTGGATAA 


GCGGGACTGC 


GAGAACTACA 


TCACTCTCCT 


GGAGAGGCGG 


420 


5 


AGTGAGGGGC 


TGCTGGCCTG 


TGGCACCAAC 


GCCCGGCACC 


CCAGCTGCTG 


GAACCTGGTG 


480 




AATGGCACTG 


TGGTGCCACT 


TGGCGAGATG 


AGAGGCTACG 


CCCCCTTCAG 


CCCGGACGAG 


540 


10 


AACTCCCTGG 


TTCTGTTTGA 


AGGGGACGAG 


GTGTATTCCA CCATCCGGAA GCAGGAATAC 


600 




AATGGGAAGA 


TCCCTCGGTT 


CCGCCGCATC 


CGGGGCGAGA GTGAGCTGTA CACCAGTGAT 


660 




ACTGTCATGC 


AGAACCCACA 


GTTCATCAAA 


GCCACCATCG 


TGCACCAAGA 


CCAGGCTTAC 


720 


15 


GATGACAAGA 


TCTACTACTT 


CTTCCGAGAG 


GACAATCCTG 


ACAAGAATCC 


TGAGGCTCCT 


780 




CTCAATGTGT 


CCCGTGTGGC 


CCAGTTGTGC 


AGGGGGGACC 


AGGGTGGGGA 


AAGTTCACTG 


840 




TCAGTCTCCA 


AGTGGAACAC 


TTTTCTGAAA 


GCCATGCTGG 


TATGCAGTGA 


TGCTGCCACC 


900 


20 


AACAAGAACT 


TCAACAGGCT 


GCAAGACGTC 


TTCCTGCTCC 


CTGACCCCAG 


CGGCCAGTGG 


960 




AGGGACACCA 


GGGTCTATGG 


TGTTTTCTCC 


AACCCCTGGA 


ACTACTCAGC 


CGTCTGTGTG 


1020 


25 


TATTCCCTCG 


GTGACATTGA 


CAAGGTCTTC 


CGTACCTCCT 


CACTCAAGGG 


CTACCACTCA 


1080 


AGCCTTCCCA 


ACCCGCGGCC 


TGGCAAGTGC 


CTCCCAGACC 


AGCAGCCGAT 


ACCCACAGAG 


1140 




ACCTTCCAGG 


TGGCTGACCG 


TCACCCAGAG 


GTGGCGCAGA 


GGGTGGAGCC 


CATGGGGCCT 


1200 


30 


CTGAAGACGC 


CATTGTTCCA 


CTCTAAATAC 


CACTACCAGA 


AAGTGGCCGT 


TCACCGCATG 


1260 




CAAGCCAGCC 


ACGGGGAGAC 


CTTTCATGTG 


CTTTACCTAA 


CTACAGACAG 


GGGCACTATC 


1320 




CACAAGGTGG 


TGGAACCGGG 


GGAGCAGGAG 


CACAGCTTCG 


CCTTCAACAT 


CATGGAGATC 


1380 


35 


CAGCCCTTCC 


GCCGCGCGGC 


TGCCATCCAG 


ACCATGTCGC 


TGGATGCTGA GCGGAGGAAG 


1440 




CTGTATGTGA 


GCTCCCAGTG 


GGAGGTGAGC 


CAGGTGCCCC 


TGGACCTGTG 


TGAGGTCTAT 


1500 


40 


GGCGGGGGCT 


GCCACGGTTG 


CCTCATGTCC 


CGAGACCCCT 


ACTGCGGCTG 


GGACCAGGGC 


1560 


CGCTGCATCT 


CCATCTACAG 


CTCCGAACGG 


TCAGTGCTGC 


AATCCATTAA 


TCCAGCCGAG 


1620 




CCACACAAGG 


AGTGTCCCAA 


CCCCAAACCA 


GACAAGGCCC 


CACTGCAGAA 


GGTTTCCCTG 


1680 


45 


GCCCCAAACT 


CTCGCTACTA 


CCTGAGCTGC 


CCCATGGAAT 


CCCGCCACGC 


CACCTACTCA 


1740 




TGGCGCCACA 


AGGAGAACGT 


GGAGCAGAGC 


TGCGAACCTG 


GTCACCAGAG 


CCCCAACTGC 


1800 




ATCCTGTTCA 


TCGAGAACCT 


CACGGCGCAG 


CAGTACGGCC 


ACTACTTCTG 


CGAGGCCCAG 


1860 


50 


GAGGGCTCCT 


ACTTCCGCGA 


GGCTCAGCAC 


TGGCAGCTGC 


TGCCCGAGGA 


CGGCATCATG 


1920 




GCCGAGCACC 


TGCTGGGTCA 


TGCCTGTGCC 


CTGGCTGCCT 


CCCTCTGGCT 


GGGGGTGCTG 


1980 
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w 



CCCACACTCA CTCTTGGCTT GCTGGTCCAC TAGGGCCTCC CGAGGCTGGG CATGCCTCAG 2 04 0 

GCTTCTGCAG CCCAGGGCAC TAGAACGTCT CACACTCAGA GCCGGCTGGC CCGGGAGCTC 2100 

CTTGCCTGCC ACTTCTTCCA GGGGACAGAA TAACCCAGTG GAGGATGCCA GGCCTGGAGA 2160 

CGTCCAGCCG CAGGCGGCTG CTGGGCCCCA GGTGGCGCAC GGATGGTGAG GGGCTGAGAA 2220 

TGAGGGCACC GACTGTGAAG CTGGGGCATC GATGACCCAA GACTTTATCT TCTGGAAAAT 2280 

ATTTTTCAGA CTCCTCAAAC TTGACTAAAT GCAGCGATGC TCCCAGCCCA AGAGCCCATG 2340 

GGTCGGGGAG TGGGTTTGGA TAGGAGAGCT GGGACTCCAT CTCGACCCTG GGGCTGAGGC 24 00 

CTGAGTCCTT CTGGACTCTT GGTACCCACA TTGCCTCCTT CCCCTCCCTC TCTCATGGCT 2460 

GGGTGGCTGG TGTTCCTGAA GACCCAGGGC TACCCTCTGT CCAGCCCTGT CCTCTGCAGC 2 520 

TCCCTCTCTG GTCCTGGGTC CCACAGGACA GCCGCCTTGC ATGTTTATTG AAGGATGTTT 2580 

GCTTTCCGGA CGGAAGGACO GAAAAAGCTC TGA/^J^J^-AAAA AAAAAAAAAA AAAAAA 2636 



20 



25 



30 



40 



45 



(2) INFORMATION ZU SEQ ID NO: 2: 

(i) SEQUEN2 CHARAKTERISTIKA: 

(A) LANGE: 1195 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 
^5 (A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. - 1195 



(xi) SEQUENZBESCHREIBUNG; SEQ ID NO: 2: 

CGGGGCTGCG GGATGACGCC TCCTCCTCCC GGACGTGCCG CCCCCAGCGC ACCGCGCGCC 60 

CGCGTCCTCA GCCTGCCGGC TCGGTTCGGG CTCCCGCTGC GGCTGCGGCT TCTGCTGGTG 120 

TTCTGGGTGG CCGCCGCCTC CGCCCAAGGC CACTCGAGGA GCGGACCCCG CATCTCCGCC 180 

GTCTGGAAAG GGCAGGACCA TGTGGACTTT AGCCAGCCTG AGCCACACAC CGTGCTTTTC 240 

CATGAGCCGG GCAGCTTCTC TGTCTGGGTG GGTGGACGTG GCAAGGTCTA CCACTTCAAC 300 

50 TTCCCCGAGG GCAAGAATGC CTCTGTGCGC ACGGTGAACA TCGGCTCCAC AAAGGGGTCC 360 

TGTCAGGACA AACAGGACTG TGGGAATTAC ATCACTCTTC TAGAAAGGCG GGGTAATGGG 420 
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CTGCTGGTCT GTGGCACCAA TGCCCGGAAG CCCAGCTGCT GGAACTTGGT GAATGACAGT 4 80 

GTGGTGATGT CACTTGGTGA GATGAAAGGC TATGCCCCCT TCAGCCCGGA TGAGAACTCC 54 0 

5 

CTGGTTCTGT TTGAAGGAGA TGAAGTGTAC TCTACCATCC GGAAGCAGGA ATACAACGGG 600 

AAGATCCCTC GGTTTCGACG CATTCGGGGC GAGAGTGAAC TGTACACAAG TGATACAGTC 660 

W ATGCAGAACC CACAGTTCAT CAAGGCCACC ATTGTGCACC AAGACCAAGC CTATGATGAT 72 0 

AAGAtCTACT ACTTCTTCCG AGAAGACAAC CCTGACAAGA ACCCCGAGGC TCCTCTCAAT 780 

GTGTCCCGAG TAGCCCAGTT GTGCAGGGGG GACCAGGGTG GTGAGAGTTC GTTGTCTGTC 84 0 

TCCAAGTGGA ACACCTTCCT GAAAGCCATG TTGGTCTGCA GCGATGCAGC CACCAACAGG 900 

AACTTCAATC GGCTGCAAGA TGTCTTCCTG CTCCCTGACC CCAGTGGCCA GTGGAGAGAT 960 
ACCAGGGTCT ATGGCGTTTT CTCCAACCCC TGGAACTACT CAGCTGTCTG CGTGTATTCG • 1020 

CTTGGTGACA TTGACAGAGT CTTCCGTACC TCATGGCTCA AAGGCTACCA CATGGGCCTT 1080 

TCCAACCCTC GACCTGGCAT GTGCCTCCCA AAAAAGCAGC CCATACCCAC AGAAACCTTC 114 0 

CAGGTAGCTG ATAGTCACCC AGAGGTGGCT CAGAGGGTGG AACCTATGGG GCCCC 1195 



15 



20 



25 



30 



35 



45 



50 



(2) INFORMATION ZU SEQ ID NO: 3: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 666 Aminosauren 

(B) ART : Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 



(ix) MERKMALE: 
40 (A) NAME/SCHLUSSEL: Protein 

(B) LAGE: 1..666 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 3: 

Met Thr Pro Pro Pro Pro Gly Arg Ala Ala Pro Ser Ala Pro Arg Ala 

15 10 15 

Arg Val Pro Gly Pro Pro Ala Arg Leu Gly Leu Pro Leu Arg Leu Arg 

20 25 30 

Leu Leu Leu Leu Leu Trp Ala Ala Ala Ala Ser Ala Gin Gly His Leu 
35 40 45 
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Arg Ser Gly Pro Arg He Phe Ala Val Trp Lys Gly His Val Gly Gin 
50 55 60 

Asp Arg Val Asp Phe Gly Gin Thr Glu Pro His Thr Val Leu Phe His 
65 70 75 80 

Glu Pro Gly Ser Ser Ser Val Trp Val Gly Gly Arg Gly Lys Val Tyr 
85 90 95 

Leu Phe Asp Phe Pro Glu Gly Lys Asn Ala Ser Val Arg Thr Val Asn 
100 105 110 

lie Gly Ser Thr Lys Gly Ser Cys Leu Asp Lys Arg Asp Cys Glu Asn 
115 120 125 

Tyr He Thr Leu Leu Glu Arg Arg Ser Glu Gly Leu Leu Ala Cys Gly 
130 135 140 

Thr Asn Ala Arg His Pro Ser Cys Trp Asn Leu Val Asn Gly Thr Val 
145 150 155 160 

Val Pro Leu Gly Glu Met Arg Gly Tyr Ala Pro Phe Ser Pro Asp Glu 
165 170 175 

Asn Ser Leu Val Leu Phe Glu Gly Asp Glu Val Tyr Ser Thr lie Arg 
180 185 190 

Lys Gin Glu Tyr Asn Gly Lys He Pro Arg Phe Arg Arg He Arg Gly 
195 200 205 

Glu Ser Glu Leu Tyr Thr Ser Asp Thr Val Met Gin Asn Pro Gin Phe 
230 215 220 

He Lys Ala Thr He Val His Gin Asp Gin Ala Tyr Asp Asp Lys He 
225 230 235 240 

Tyr Tyr Phe Phe Arg Glu Asp Asn Pro Asp Lys Asn Pro Glu Ala Pro 
245 250 255 

Leu Asn Val Ser Arg Val Ala Gin Leu Cys Arg Gly Asp Gin Gly Gly 
260 265 270 

Glu Ser Ser Leu Ser Val Ser Lys Trp Asn Thr Phe Leu Lys Ala Met 
275 280 285 

Leu Val Cys Ser Asp Ala Ala Thr Asn Lys Asn Phe Asn Arg Leu Gin 
290 295 300 



Asp Val Phe Leu Leu Pro Asp Pro Ser Gly Gin Trp Arg Asp Thr Arg 
305 310 315 320 



Val Tyr Gly Val Phe Ser Asn Pro Trp Asn Tyr Ser Ala Val Cys Val 
325 330 335 



EP 0 892 047 A2 



10 



Tyr Ser Leu Gly Asp He Asp Lys Val Phe Arg Thr Ser Ser Leu Lys 
340 345 350 

Gly Tyr His Ser Ser Leu Pro Asn Pro Arg Pro Gly Lys Cys Leu Pro 
355 360 365 

Asp Gin Gin Pro He Pro Thr Glu Thr Phe Gin Val Ala Asp Arg His 
370 375 380 

Pro Glu Val Ala Gin Arg Val Glu Pro Met Gly Pro Leu Lys Thr Pro 
385 390 395 400 



15 



Leu Phe His Ser Lys Tyr His Tyr Gin Lys Val Ala Val His Arg Met 
405 410 415 



Gin Ala Ser His Gly Glu Thr Phe His Val Leu Tyr Leu Thr Thr Asp 
420 425 430 



20 



Arg Gly Thr He His Lys Val Val Glu Pro Gly Glu Gin Glu His Ser 
435 440 445 



Phe Ala Phe Asn He Met Glu He Gin Pro Phe Arg Arg Ala Ala Ala 
450 455 460 



25 



He Gin Thr Met Ser Leu Asp Ala Glu Arg Arg Lys Leu Tyr Val Ser 
465 470 475 480 



30 



Ser Gin Trp Glu Val Ser Gin Val Pro Leu Asp Leu Cys Glu Val Tyr 
485 490 495 

Gly Gly Gly Cys His Gly Cys Leu Met Ser Arg Asp Pro Tyr Cys Gly 
500 505 510 



35 



Trp Asp Gin Gly Arg Cys He Ser He Tyr Ser Ser Glu Arg Ser Val 
515 520 525 



Leu Gin Ser He Asn Pro Ala Glu Pro His Lys Glu Cys Pro Asn Pro 
530 535 540 



40 



Lys Pro Asp Lys Ala Pro Leu Gin Lys Val Ser Leu Ala Pro Asn Ser 
545 550 555 560 



45 



Arg Tyr Tyr Leu Ser Cys Pro Met Glu Ser Arg His Ala Thr Tyr Ser 
565 570 575 

Trp Arg His Lys Glu Asn Val Glu Gin Ser Cys Glu Pro Gly His Gin 
580 585 590 



50 



Ser Pro Asn Cys He Leu Phe He Glu Asn Leu Thr Ala Gin Gin Tyr 

595 600 605 

Gly His Tyr Phe Cys Glu Ala Gin Glu Gly Ser Tyr Phe Arg Glu Ala 

610 615 620 
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w 



15 



20 



25 



30 



45 



50 



Gin His Trp Gin Leu Leu Pro Glu Asp Gly lie Met Ala Glu His Leu 
625 630 635 640 



Leu Gly His Ala Cys Ala Leu Ala Ala Ser Leu Trp Leu Gly Val Leu 

645 650 655 

Pro Thr Leu Thr Leu Gly Leu Leu Val His 

660 665 



(2) INFORMATION ZU SEQ ID NO : 4 : 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 3 94 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: Protein 

(B) LAGE: 1..394 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 

Met Thr Pro Pro Pro Pro Gly Arg Ala Ala Pro Ser Ala Pro Arg Ala 
1 5 10 15 

Arg Val Leu Ser Leu Pro Ala Arg Phe Gly Leu Pro Leu Arg Leu Arg 
20 25 30 

Leu Leu Leu Val Phe Trp Val Ala Ala Ala Ser Ala Gin Gly His Ser 
35 40 45 

Arg Ser Gly Pro Arg lie Ser Ala Val Trp Lys Gly Gin Asp His Val 
50 55 60 

40 Asp Phe Ser Gin Pro Glu Pro His Thr Val Leu Phe His Glu Pro Gly 

65 70 ^ 75 80 

Ser Phe Ser Val Trp Val Gly Gly Arg Gly Lys Val Tyr His Phe Asn 
85 90 95 



Phe Pro Glu Gly Lys Asn Ala Ser Val Arg Thr Val Asn lie Gly Ser 
100 105 110 

Thr Lys Gly Ser Cys Gin Asp Lys Gin Asp Cys Gly Asn Tyr lie Thr 
115 120 125 

Leu Leu Glu Arg Arg Gly Asn Gly Leu Leu Val Cys Gly Thr Asn Ala 
130 135 140 
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Arg Lv, P„ cys trp »s„ val A.„ v.l val „„ Ser 

teu Cl, oi„ .y. Oli- Tyr Ma Pro Ph. s,r P„ A,p oi„ a,„ ser 

" 170 „5 

Le„ val .eu Ph. alu Gly oi„ Val ryr s.r Th. „. 

Olu ryr Aa„ oly .ya n. P„ ^, P., 

205 

Olu Leu Tyr Thr Ser Asp Thr Val Met Gin Aan Pro Gin Phe He Lys 

220 

«a Th, 11. v.l „la Oln A,p =1„ „. „p 



235 



Phe Phe Arg Glu Asp Asn Pro Asp Lys Asn Pro Glu Ala 



245 



250 



240 



Pro Leu Asn 

255 



val ser Arg Val Ala Gin Leu Cys Arg Gly Asp Gin Gly oly Glu Ser 



265 



270 



ser Leu Ser Val Ser Lye Trp Asn Thr Phe Leu Lys Ala Met Leu Val 

290 285 

cys ser ASP Ala Ala Thr Asn Arg Asn Phe Asn Arg Leu Gin Asp Val 

295 200 

Phe Leu Leu Pro Asp Pro Ser Glv Gin tv^ « 

305 inn ^ ^9 Val Tyr 

315 320 

Gly val Phe Ser Asn Pro Trp Asn Tyr Ser Ala Val Cys Val Tyr Ser 

325 330 335 

Leu Gly Asp lie Asp Arg Val Phe Arg Thr Ser Ser Leu Lys Gly Tyr 

j40 ^ac 

345 350 

His Met Gly Leu Ser Asn Pro Arg Pro Gly Met Cys Leu Pro Lys Lys 

365 

Gin Pro lie Pro Thr Glu Thr Phe Gin Val Ala Asp Ser His Pro Glu 

Val Ala Gin Arg Val Glu Pro Met Gly Pro 



385 



390 
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(2) INFORMATION ZU SEQ ID NO : 5: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 23 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1 . . 23 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5: 
ACTCACTATA GGGCTCGAGC GGC 



(2) INFORMATION ZU SEQ ID NO: 6: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. . 20 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 
AGCCGCACAC GGTGCTTTTC 



(2) INFORMATION ZU SEQ ID NO: 7: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .20 
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(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 7: 
GCACAGATGC GTTCTTGCCC 



(2) INFORMATION ZU SEQ ID NO : 8: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..20 



ixi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 8: 
ACCATAGACC CTGGTGTCCC 



(2) INFORMATION ZU SEQ ID NO: 9: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 2 0 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .20 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 
GCAGTGATGC TGCCACCAAC 



(2) INFORMATION ZU SEQ ID NO : 10: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 
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(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LACE: 1..20 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10 
CCAGACCATG TCGCTGGATG 



(2) INFORMATION ZU SEQ ID NO : 11: 

(i) SEQUEN2 CHARAKTBRISTIKA : 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1 . . 20 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 
ACATGAGGCA ACCGTGGCAG 



(2) INFORMATION ZU SEQ ID NO: 12: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 27 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 
CCATCCTAAT ACGACTCACT ATAGGGC 
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(2) INFORMATION ZU SEQ ID NO: 13: 



(i) SEQOENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .20 



(xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 13 
AGGTAGACCT TGCCACGTCC 



(2) INFORMATION ZU SEQ ID NO: 14: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 23 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..2 3 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 
GAACTTCAAC AGGCTGCAAG ACG 



(2) INFORMATION ZU SEQ ID NO: 15: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 
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(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .20 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 15: 
ATGCTGAGCG GAGGAAGCTG 



(2) INFORMATION ZU SEQ ID NO: 16: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleins^ure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 16: 
CCGCCATACA CCTCACACAG 



(2) INFORMATION ZU SEQ ID NO: 17: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 28 Basenpaare 

(B) ART : Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .28 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17 
CTGGAAGCTT TCTGTGGGTA TCGGCTGC 



(2) INFORMATION ZU SEQ ID NO: 18: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 25 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 
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(ii) ART DES MOLEKULS: DNS (genotnisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1 . .25 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: 
TTTGGATCCC TGGTTCTGTT TGAAG 

(2) INFORMATION ZU SEQ ID NO: 19: 

(i) SEQUENZ CHARAiCTERISTIKA: 

(A) LANGE: 50 Basenpaare 

(B) ART: NuJcleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .50 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 19: 
TTCTAGAATT CAGCGGCCGC TTTTTTTTTT TTTTTTTTTT T 

(2) INFORMATION 2U SEQ ID NO: 20: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 27 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: axon 

(B) LAGE: 1..27 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 20: 



GGGGAAAGTT CACTGTCAGT CTCCAAG 
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(2) INFORMATION ZU SEQ ID NO : 21: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 26 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 21 
GGGAATACAC ACAGACGGCT GAGTAG 



(2) INFORMATION ZU SEQ ID NO: 22: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1 . . 22 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 22 
AGCAAGTTCA GCCTGGTTAA GT 



(2) INFORMATION ZU SEQ ID NO: 23: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 21 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. ,21 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2 3 
TTATGAGTAT TTCTTCCAGG G 



(2) INFORMATION ZU SEQ ID NO: 24: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 2 6 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .26 



(xi) SEQUENZBESCHREIBUNG: SEQ ID KGi 24: 
CCATTAATCC AGCCGAGCCA CACAAG 



(2) INFORMATION ZU SEQ ID NO : 25: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 25 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .25 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 25: 
CATCTACAGC TCCGAACGGT CAGTG 



(2) INFORMATION 2U SEQ ID NO: 26: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 
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(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .20 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26: 
CAGCGGAAGC CCCAACCGAG 



(2) INFORMATION ZU SEQ ID NO : 27: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 23 Basenpaare 

(B) ART: NukleinsSure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..23 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 27: 
GGGATGACGC CTCCTCCGCC CGG 



(2) INFORMATION ZU SEQ ID NO: 28: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 31 Basenpaare 

(B) ART: Nukleins^ure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: axon 

(B) LAGE: 1. .31 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2 8 
AAGCTTCACG TGGACCAGCA AGCCAAGAGT G 
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(2) INFORMATION ZU SEQ ID NO : 29: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 25 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..25 



(xi) SEQUENZBESCHREIBUNG; SEQ ID NO: 2 9 
AAGCTTTTTC CGTCCTTCCG TCCGG 



(2) INFORMATION ZU SEQ ID NO : 30: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 24 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .24 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 30 
ATGGTGAGCA AGGGCGAGGA GCTG 



(2) INFORMATION ZU SEQ ID NO : 31: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 24 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 
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(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..24 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 31 
CTTGTACAGC TCGTCCATGC CGAG 



(2) INFORMATION ZU SEQ ID NO: 32: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 25 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..25 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 32 
GGGTGGTGAG AGTTCGTTGT CTGTC 



(2) INFORMATION ZU SEQ ID NO : 33- 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 25 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .25 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3 3 
GAGCGATGAG GTACGGAAGA CTCTG 
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(2) INFORMATION ZU SEQ ID NO: 34: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 5856 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1 . . 5856 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34: 

AGCGCCCAAT ACGCAAACCG CCTCTCCCCG CGCGTTGGCC GATTCATTAA TGCAGCTGGC 60 

ACGACAGGTT TCCCGACTGG AAAGCGGGCA GTGAGCGCAA CGCAATTAAT GTGAGTTAGC 120 

TCACTCATTA GGCACCCCAG GCTTTACACT TTATGCTTCC GGCTCGTATG TTGTGTGGAA 18 0 

TTGTGAGCGG ATAACAATTT CACACAGGAA ACAGCTATGA CCATGATTAC GCCAAGCTTC 24 0 

ACGTGGACCA GCAAGCCAAG AGTGAGTGTG GGCAGCACCC CCAGCCAGAG GGAGGCAGCC 30 0 

AGGGCACAGG CATGACCCAG CAGGTGCTCG GCCATGATGC CGTCCTCGGG CAGCAGCTGC 360 

30 CAGTGCTGAG CCTCGCGGAA GTAGGAGCCC TCCTGGGCCT CGCAGAAGTA GTGGCCGTAC 42 0 

TGCTGCGCCG TGAGGTTCTC GATGAACAGG ATGCAGTTGG GGCTCTGGTG ACCAGGTTCG 4 80 

CAGCTCTGCT CCACGTTCTC CTTGTGGCGC CATGAGTAGG TGGCGTGGCG GGATTCCATG 54 0 

GGGCAGCTCA GGTAGTAGCG AGAGTTTGGG GCCAGGGAAA CCTTCTGCAG TGGGGCCTTG 600 

TCTGGTTTGG GGTTGGGACA CTCCTTGTGT GGCTCGGCTG GATTAATGGA TTGCAGCACT 660 

GACCGTTCGG AGCTGTAGAT GGAGATGCAG CGGCCCTGGT CCCAGCCGCA GTAGGGGTCT 72 0 

CGGGACATGA GGCAACCGTG GCAGCCCCCG CCATAGACCT CACACAGGTC CAGGGGCACC 78 0 

TGGCTCACCT CCCACTGGGA GCTCACATAC AGCTTCCTCC GCTCAGCATC CAGCGACATG 84 0 

^5 GTCTGGATGG CAGCCGCGCG GCGGAAGGGC TGGATCTCCA TGATGTTGAA GGCGAAGCTG 900 

TGCTCCTGCT CCCCCGGTTC CACCACCTTG TGGATAGTGC CCCTGTCTGT AGTTAGGTAA 960 

AGCACATGAA AGGTCTCCCC GTGGCTGGCT TGCATGCGGT GAACGGCCAC TTTCTGGTAG 102 0 

TGGTATTTAG AGTGGAACAA TGGCGTCTTC AGAGGCCCCA TGGGCTCCAC CCTCTGCGCC 108 0 

ACCTCTGGGT GACGGTCAGC CACCTGGAAG GTCTCTGTGG GTATCGGCTG CTGGTCTGGG 114 0 
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AGGCACTTGC CAGGCCGCGG GTTGGGAAGG CTTGAGTGGT AGCCCTTGAG TGAGGAGGTA 12 00 

CGGAAGACCT TGTCAATGTC ACCGAGGGAA TACACACAGA CGGCTGAGTA GTTCCAGGGG 1260 

5 

TTGGAGAAAA CACCATAGAC CCTGGTGTCC CTCCACTGGC CGCTGGGGTC AGGGAGCAGG 1320 

AAGACGTCTT GCAGCCTGTT GAAGTTCTTG TTGGTGGCAG CATCACTGCA TACCAGCATG 13 8 0 

JO GCTTTCAGAA AAGTGTTCCA CTTGGAGACT GACAGTGAAC TTTCCCCACC CTGGTCCCCC 144 0 

CTGCACAACT GGGCCACACG GGACACATTG AGAGGAGCCT CAGGATTCTT GTCAGGATTG 1500 

TCCTCTCGGA AGAAGTAGTA GATCTTGTCA TCGTAAGCCT GGTCTTGGTG CACGATGGTG 1560 

GCTTTGATGA ACTGTGGGTT CTGCATGACA GTATCACTGG TGTACAGCTC ACTCTCGCCC 1620 

CGGATGCGGC GGAACCGAGG GATCTTCCCA TTGTATTCCT GCTTCCGGAT GGTGGAATAC 1680 

ACCTCGTCCC CTTCAAACAG AACCAGGGAG TTCTCGTCCG GGCTGAAGGG GGCGTAGCCT 174 0 

20 

CTCATCTCGC CAAGTGGCAC CACAGTGCCA TTCACCAGGT TCCAGCAGCT GGGGTGCCGG 1800 

GCGTTGGTGC CACAGGCCAG CAGCCCCTCA CTCCGCCTCT CCAGGAGAGT GATGTAGTTC 1860 

^5 TCGCAGTCCC GCTTATCCAG ACAGGACCCC TTTGTGGAGC CGATATTCAC CGTGCGCACA 192 0 

GATGCGTTCT TGCCCTCGGG GAAGTCAAAG AGGTAGACCT TGCCACGTCC TCCCACCCAC 1980 

ACAGAGGAGC TGCCTGGCTC GTGGAAAAGC ACCGTGTGCG GCTCAGTCTG GCCAAAGTCC 2 04 0 

30 

ACCCGGTCCT GCCCTACATG GCCTTTCCAG ACGGCGAAGA TGCGGGGTCC GCTCCTTAGG 2100 

TGGCCCTGGG CGGAGGCGGC GGCCGCCCAG AGCAGCAGCA GCAGCCGCAG CCGCAGCGGA 2160 

25 AGCCCCAACC GAGCCGGCGG GCCAGGGACG CGGGCGCGCG GTGCGCTGGG GGCGGCACGT 2220 

CCGGGCGGAG GAGGCGTCAT CCCAAGCCGA ATTCTGCAGA TATCCATCAC ACTGGCGGCC 2280 

GCTCGAGCAT GCATCTAGAG GGCCCAATTC GCCCTATAGT GAGTCGTATT ACAATTCACT 2340 

40 

GGCCGTCGTT TTACAACGTC GTGACTGGGA AAACCCTGGC GTTACCCAAC TTAATCGCCT 2400 

TGCAGCACAT CCCCCTTTCG CCAGCTGGCG TAATAGCGAA GAGGCCCGCA CCGATCGCCC 24 60 

TTCCCAACAG TTGCGCAGCC TGAATGGCGA ATGGGACGCG CCCTGTAGCG GCGCATTAAG 2520 

45 

CGCGGCGGGT GTGGTGGTTA CGCGCAGCGT GACCGCTACA CTTGCCAGCG CCCTAGCGCC 2580 

CGCTCCTTTC GCTTTCTTCC CTTCCTTTCT CGCCACGTTC GCCGGCTTTC CCCGTCAAGC 2640 

50 TCTAAATCGG GGGCTCCCTT TAGGGTTCCG ATTTAGAGCT TTACGGCACC TCGACCGCAA 2700 

AAAACTTGAT TTGGGTGATG GTTCACGTAG TGGGCCATCG CCCTGATAGA CGGTTTTTCG 2760 
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CCCTTTGACG 


TTGGAGTCCA 


CGTTCTTTAA 


TAGTGGACTC 


TTGTTCCAAA 


CTGGAACAAC 


2820 


ACTCAACCCT 


ATCGCGGTCT 


ATTCTTTTGA 


TTTATAAGGG 


ATTTTGCCGA 


TTTCGGCCTA 


2880 


TTGGTTAAAA 


AATGAGCTGA 


TTTAACAAAT 


TCAGGGCGCA 


AGGGCTGCTA 


AAGGAACCGG 


2940 


AACACGTAGA 


AAGCCAGTCC 


GCAGAAACGG 


TGCTGACCCC 


GGATGAATGT 


CAGCTACTGG 


3000 


GCTATCTGGA 


CAAGGGAAAA 


CGCAAGCGCA 


AAGAGAAAGC 


AGGTAGCTTG 


CAGTGGGCTT 


3060 


ACATGGCGAT 


AGCTAGACTG 


GGCGGTTTTA 


TGGACAGCAA 


GCGAACCGGA 


ATTGCCAGCT 


3120 


GGGGCGCCCT 


CTGGTAAGGT 


TGGGAAGCCC 


TGCAAAGTAA 


ACTGGATGGC 


TTTCTTGCCG 


3180 


CCAAGGATCT 


GATGGCGCAG 


GGGATCAAGA 


TCTGATCAAG 


AGACAGGATG 


AGGATCGTTT 


3240 


CGCATGATTG 


AACAAGATGG 


ATTGCACGCA 


GGTTCTCCGG 


CCGCTTGGGT 


GGAGAGGCTA 


3300 


TTCGGCTATG 


ACTGGGCACA 


ACAGACAATC 


GGCTGCTCTG 


ATGCCGCCGT 


GTTCCGGCTG 


3360 


TCAGCGCAGG 


GGCGCCCGGT 


TCTTTTTGTC 


AAGACCGACC 


TGTCCGGTGC 


CCTGAATGAA 


3420 


CTGCAGGACG 


AGGCAGCGCG 


GCTATCGTGG 


CTGGCCACGA 


CGGGCGTTCC 


TTGCGCAGCT 


3480 


GTGCTCGACG 


TTGTCACTGA 


AGCGGGAAGG 


GACTGGCTGC 


TATTGGGCGA 


AGTGCCGGGG 


3540 


CAGGATCTCC 


TGTCATCTCG 


CCTTGCTCCT 


GCCGAGAAAG 


TATCCATCAT 


GGCTGATGCA 


3600 


ATGCGGCGGC 


TGCATACGCT 


TGATCCGGCT 


ACCTGCCCAT 


TCGACCACCA 


AGCGAAACAT 


3660 


CGCATCGAGC 


GAGCACGTAC 


TCGGATGGAA 


GCCGGTCTTG 


TCGATCAGGA 


TGATCTGGAC 


3720 


GAAGAGCATC 


AGGGGCTCGC 


GCCAGCCGAA 


CTGTTCGCCA 


GGCTCAAGGC 


GCGCATGCCC 


3780 


GACGGCGAGG 


ATCTCGTCGT 


GATCCATGGC 


GATGCCTGCT 


TGCCGAATAT 


CATGGTGGAA 


3840 


AATGGCCGCJ TTTCTGGATT CAACGACTGT GGCCGGCTGG GTGTGGCGGA 


CCGCTATCAG 


3900 


GACATAGCGT 


TGGATACCCG 


TGATATTGCT 


GAAGAGCTTG 


GCGGCGAATG 


GGCTGACCGC 


3960 


TTCCTCGTGC 


TTTACGGTAT 


CGCCGCTCCC 


GATTCGCAGC 


GCATCGCCTT 


CTATCGCCTT 


4020 


CTTGACGAGT 


TCTTCTGAAT 


TGAAAAAGGA 


AGAGTATGAG 


TATTCAACAT 


TTCCGTGTCG 


4080 


CCCTTATTCC 


CTTTTTTGCG 


GCATTTTGCC 


TTCCTGTTTT 


TGCTCACCCA 


GAAACGCTGG 


4140 


TGAAAGTAAA 


AGATGCTGAA 


GATCAGTTGG 


GTGCACGAGT 


GGGTTACATC 


GAACTGGATC 


4200 


TCAACAGCGG 


TAAGATCCTT 


GAGAGTTTTC 


GCCCCGAAGA 


ACGTTTTCCA 


ATGATGAGCA ' 


4260 


CTTTTAAAGT 


TCTGCTATGT 


CATACACTAT 


TATCCCGTAT 


TGACGCCGGG 


CAAGAGCAAC 


4320 


TCGGTCGCCG 


GGCGCGGTAT 


TCTCAGAATG 


ACTTGGTTGA 


GTACTCACCA 


GTCACAGAAA 


4380 


AGCATCTTAC 


GGATGGCATG 


ACAGTAAGAG 


AATTATGCAG 


TGCTGCCATA 


ACCATGAGTG 


4440 
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ATAACACTGC GGCCAACTTA CTTCTGACAA CGATCGGAGG ACCGAAGGAG CTAACCGCTT 4 500 

TTTTGCACAA CATGGGGGAT CATGTAACTC GCCTTGATCG TTGGGAACCG GAGCTGAATG 4560 

AAGCCATACC AAACGACGAG AGTGACACCA CGATGCCTGT AGCAATGCCA ACAACGTTGC 4620 

GCAAACTATT AACTGGCGAA CTACTTACTC TAGCTTCCCG GCAACAATTA ATAGACTGGA 4680 

TGGAGGCGGA TAAAGTTGCA GGACCACTTC TGCGCTCGGC CCTTCCGGCT GGCTGGTTTA 474 0 

TTGCTGATAA ATCTGGAGCC GGTGAGCGTG GGTCTCGCGG TATCATTGCA GCACTGGGGC 4800 

CAGATGGTAA GCCCTCCCGT ATCGTAGTTA TCTACACGAC GGGGAGTCAG GCAACTATGG 4860 
ATGAACGAAA TAGACAGATC GCTGAGATAG GTGCCTCACT GATTAAGCAT TGGTAACTGT ' 4 920 

CAGACCAAGT TTACTCATAT ATACTTTAGA TTGATTTAAA ACTTCATTTT TAATTTAAAA 4980 

GGATCTAGGT GAAGATCCTT TTTGATAATC TCATGACCAA AATCCCTTAA CGTGAGTTTT 504 0 

CGTTCCACTG AGCGTCAGAC CCCGTAGAAA AGATCAAAGG ATCTTCTTGA GATCCTTTTT 5100 

TTCTGCGCGT AATCTGCTGC TTGCAAACAA AAAAACCACC GCTACCAGCG GTGGTTTGTT 5160 

25 TGCCGGATCA AGAGCTACCA ACTCTTTTTC CGAAGGTAAC TGGCTTCAGC AGAGCGCAGA 5220 

TACCAAATAC TGTCCTTCTA GTGTAGCCGT AGTTAGGCCA CCACTTCAAG AACTCTGTAG 5280 

CACCGCCTAC ATACCTCGCT CTGCTAATCC TGTTACCAGT GGCTGCTGCC AGTGGCGATA 534 0 

AGTCGTGTCT TACCGGGTTG GACTCAAGAC GATAGTTACC GGATAAGGCG CAGCGGTCGG 54 00 

GCTGAACGGG GGGTTCGTGC ACACAGCCCA GCTTGGAGCG AACGACCTAC ACCGAACTGA 5460 

GATACCTACA GCGTGAGCAT TGAGAAAGCG CCACGCTTCC CGAAGGGAGA AAGGCGGACA 5520 

GGTATCCGGT AAGCGGCAGG GTCGGAACAG GAGAGCGCAC GAGGGAGCTT CCAGGGGGAA 55 80 

ACGCCTGGTA TCTTTATAGT CCTGTCGGGT TTCGCCACCT CTGACTTGAG CGTCGATTTT 564 0 

40 TGTGATGCTC GTCAGGGGGG CGGAGCCTAT GGAAAAACGC CAGCAACGCG GCCTTTTTAC 5700 

GGTTCCTGGC CTTTTGCTGG CCTTTTGCTC ACATGTTCTT TCCTGCGTTA TCCCCTGATT 5760 

CTGTGGATAA CCGTATTACC GCCTTTGAGT GAGCTGATAC CGCTCGCCGC AGCCGAACGA 5820 

CCGAGCGCAG CGAGTCAGTG AGCGAGGAAG CGGAAG 5856 
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(2) INFORMATION ZU SEQ ID NO : 35: 

(i) SEQUEN2 CHARAKTERISTIKA : 

(A) LANGE: 7475 Basenpaare 

(B) ART: Nukleinsaure 
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(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .7475 



(xi) SEQUENZBESCHREIBUNG: SBQ ID NO: 35: 

GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC TGCTCTGATG 60 

CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT GGAGGTCGCT GAGTAGTGCG 120 

CGAGCAAAAT TTAAGCTACA ACAAGGCAAG GCTTGACCGA CAATTGCATG AAGAATCTGC 180 

TTAGGGTTAG GCGTTTTGCG CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT 240 

GATTATTGAC TAGTTATTAA TAGTAATCAA TTACGGGGTC AT-TAGTTCAT AGCCCATATA 300 

TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG CCCAACGACC 360 

CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT AACGCCAATA GGGACTTTCC 420 

ATTGACGTCA ATGGGTGGAC TATTTACGGT AAACTGCCCA CTTGGCAGTA CATCAAGTGT 4 80 

ATCATATGCC AAGTACGCCC CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT 54 0 

ATGCCCAGTA CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 600 

TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA TAGCGGTTTG 660 

ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA TGGGAGTTTG TTTTGGCACC 720 

AAAATCAACG GGACTTTCCA AAATGTCGTA ACAACTCCGC CCCATTGACG CAAATGGGCG 780 

GTAGGCGTGT ACGGTGGGAG GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA 840 

CTGCTTACTG GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC 900 

GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT GCAGAATTCG 960 

45 GCTTGGGATG ACGCCTCCTC CGCCCGGACG TGCCGCCCCC AGCGCACCGC GCGCCCGCGT 1020 

CCCTGGCCCG CCGGCTCGGT TGGGGCTTCC GCTGCGGCTG CGGCTGCTGC TGCTGCTCTG 1080 

GGCGGCCGCC GCCTCCGCCC AGGGCCACCT AAGGAGCGGA CCCCGCATCT TCGCCGTCTG 114 0 

GAAAGGCCAT GTAGGGCAGG ACCGGGTGGA CTTTGGCCAG ACTGAGCCGC ACACGGTGCT 12 00 

TTTCCACGAG CCAGGCAGCT CCTCTGTGTG GGTGGGAGGA CGTGGCAAGG TCTACCTCTT 1260 
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TCACrrCCCC CAGCOCAAOA ACOCATCTCT aCGCACCCTC AATATCOCCT CCACAAAGGG 

CTCC^TCra oataaccgcc actcccaoaa ctacaxcact ctcctx^aca OOCCaAO^ 
GGOGCTGCTX. CCCTX3TCCCA CCAACOCCCG CCACCCCAGC TGC^aaCC TGG^aaTGO 
CACTGTGGTG CCACTTGGCG AGATGAGAGG CTACGCCCCC ^CAGCCCGG ACGAGAACTC 
CCTGGrrCTG TTTGAAGGGG ACGAGGTGTA rrcCACCATC CGGAAGCAGG AATACAATGG 
GAAGATCCCT CGGITCCGCC GCATCCGGGG CGAGAG^AG CTGTACACCA GTt^TACH^x 
CATGCAGAAC CCACAGTTCA TCAAAGCCAC CATCG1X3CAC CAAGACCAGG CTTACGATGA 
CAAGATCTAC TACTTCTTCC GAGAGGACAA TCCTGACAAG AATCCTCAGG CTCCTCTCAA 
TG1X5TCCCGT GTGGCCCAGT TGTGCAGGGG GGACCAGGGT GGGGAAAGTT CACTGTCAGT 
CTCCAAGTGG AACACTTrTC TGAAAGCCAT GCTGGTATGC AGTGATCCT^ CCACCAACAA 
GAACrrCAAC AGGCTGCAAG ACGTCTTCCT GCTCCCTGAC CCCAGCGGCC AGtX^AGGGA 
aACCAGGGTC TATGGTGrTT TCTCCAACCC CTGGAACTAC TCAGCCGTCT GlXnxJTATTC 
CCTCGGTGAC A^CAAGG TCTTCCGTAC CTCCTCACTC AAGGGCTACC ACTCAAGCCT 
TCCCAACCCG CGGCCTGGCA AGTGCCTCCC AGACCAGCAG CCGATACCCA CAGAGACCTT 
CCAGGTGGCT GACCGTCACC CAGAGGT^C GCAGAGGGT.3 GAGCCCATCG GGCCTCnx^AA 
GACX.CCAITG TTCCACTCTA AATACCACTA CCAGAAAGTtJ GCCGTTCACC GCAT^CAAGC 
CAGCCACGGG GAGACCTTTC ATGTGCnTA CCTAACTACA GACAGGGGCA CTATCCACAA 
GGTGGTGGAA CCGGGGGAGC AGGAGCACAG CTTCX5CCTTC AACATCA^ AGATCCAGCC 
CTTCCGCCGC GCGGCTGCCA TCCAGACCAT GTCGC^;,^ GCTGAGCGGA GGAAGCH^TA 
TGTGAGCTCC CAGTGGGAGG TGAGCCAGGT GCCCCTGGAC CTCTCTGAGG TCTATGGCGG 
GGGCTGCCAC GGTTGCCTCA TGTCCCGAGA CCCCTACTGC GGCKK5GACC AGGGCCGCTO 
CATCTCCATC TACAGCTCCG AACGGTCAGT GCTGCAATCC ATTAATCCAG CCGAGCCACA 
CAAGGAGTGT CCCAACCCCA AACCAGACAA GGCCCCACTG CAGAAGGTTr CCCIX3GCCCC 
AAACTCTCGC TACTACCTGA GCTGCCCCAT GGAATCCCGC CACGCCACCT ACTCATGGCG 
CCACAAGGAG AACGTGGAGC AGAGCTGCGA ACCTGGTCAC CAGAGCCCCA ACTGCATCCT 
CrrCATCGAG AACCTCACGG CGCAGCAGTA CGGCCACTAC TTCTGCGAGG CCCAGGAGGG 

CTCCTACrrC cgcgaggctc agcactggca gctgctgccc gaggacggca tcatggccga 

GCACCTGCm GGTCATGCCT GTGCCCTGGC T..CCTCCCTC TGGCTGGGGG TGCTGCCCAC 
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ACTCACTCTT GGCTTGCTGG TCCACGTGAA 
AGAGGATCTG AATAGCGCCG TCGACCATCA 

5 

TCAGCCTCGA CTGTGCCTTC TAGTTGCCAG 
TCCTTGACCC TGGAAGGTGC CACTCCCACT 
TCGCATTGTC TGAGTAGGTG TCATTCTATT 
GGGGAGGATT GGGAAGACAA TAGCAGGCAT 
GAGGCGGAAA GAACCAGCTG GGGCTCTAGG 

15 

TTAAGCGCGG CGGGTGTGGT GGTTACGCGC 
GCGCCCGCTC CTTTCGCTTT CTTCCCTTCC 
CAAGCTCTAA ATCGGGGCAT CCCTTTAGGG 

20 

CCCAAAAAAC TTGATTAGGG TGATGGTTCA 
TTTCGCCCTT TGACGTTGGA GTCCACGTTC 
25 ACAACACTCA ACCCTATCTC GGTCTATTCT 

GCCTATTGGT TAAAAAATGA GCTGATTTAA 
ATGTGTGTCA GTTAGGGTGT GGAAAGTCCC 

30 

AGCATGCATC TCAATTAGTC AGCAACCAGG 
AGAAGTATGC AAAGCATGCA TCTCAATTAG 
35 CCCATCCCGC CCCTAACTCC GCCCAGTTCC 

TTTTTTATTT ATGCAGAGGC CGAGGCCGCC 
GGAGGCTTTT TTGGAGGCCT AGGCTTTTGC 

40 

TTCGGATCTG ATCAAGAGAC AGGATGAGGA 
CACGCAGGTT CTCCGGCCGC TTGGGTGGAG 
ACAATCGGCT GCTCTGATGC CGCCGTGTTC 

45 

TTTGTCAAGA CCGACCTGTC CGGTGCCCTG 
TCGTGGCTGG CCACGACGGG CGTTCCTTGC 
50 GGAAGGGACT GGCTGCTATT GGGCGAAGTG 

GCTCCTGCCG AGAAAGTATC CATCATGGCT 



GCTTGGGCCC GAACAAAAAC TCATCTCAGA 3 00 0 

TCATCATCAT CATTGAGTTT AAACCGCTGA 3 060 

CCATCTGTTG TTTGCCCCTC CCCCGTGCCT 312 0 

GTCCTTTCCT AATAAAATGA GGAAATTGCA 318 0 

CTGGGGGGTG GGGTGGGGCA GGACAGCAAG 324 0 

GCTGGGGATG CGGTGGGCTC TATGGCTTCT 3 300 

GGGTATCCCC ACGCGCCCTG TAGCGGCGCA 3360 

AGCGTGACCG CTACACTTGC CAGCGCCCTA 34 20 

TTTCTCGCCA CGTTCGCCGG CTTTCCCCGT 34 80 

TTCCGATTTA GTGCTTTACG GCACCTCGAC 354 0 

CGTAGTGGGC CATCGCCCTG ATAGACGGTT 3 600 

TTTAATAGTG GACTCTTGTT CCAAACTGGA 3660 

TTTGATTTAT AAGGGATTTT GGGGATTTCG 3 72 0 

CAAAAATTTA ACGCGAATTA ATTCTGTGGA 3780 

CAGGCTCCCC AGGCAGGCAG AAGTATGCAA 3840 

TGTGGAAAGT CCCCAGGCTC CCCAGCAGGC 3 900 

TCAGCAACCA TAGTCCCGCC CCTAACTCCG 3960 

GCCCATTCTC CGCCCCATGG CTGACTAATT 4 020 

TCTGCCTCTG AGCTATTCCA GAAGTAGTGA 4080 

AAAAAGCTCC CGGGAGCTTG TATATCCATT 414 0 

TCGTTTCGCA TGATTGAACA AGATGGATTG 4200 

AGGCTATTCG GCTATGACTG GGCACAACAG 4260 

CGGCTGTCAG CGCAGGGGCG CCCGGTTCTT 4320 

AATGAACTGC AGGACGAGGC AGCGCGGCTA 4380 

GCAGCTGTGC TCGACGTTGT CACTGAAGCG 444 0 

CCGGGGCAGG ATCTCCTGTC ATCTCACCTT 4500 

GATGCAATGC GGCGGCTGCA TACGCTTGAT 4 560 
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CCGGCTACCT GCCCATTCGA CCACCAAGCG 
ATGGAAGCCG GTCTTGTCGA TCAGGATGAT 

5 

GCCGAACTGT TCGCCAGGCT CAAGGCGCGC 
CATGGCGATG CCTGCTTGCC GAATATCATG 
GACTGTGGCC GGCTGGGTGT GGCGGACCGC 

/o ■ 

ATTGCTGAAG AGCTTGGCGG CGAATGGGCT 
GCTCCCGATT CGCAGCGCAT CGCCTTCTAT 
15 CTCTGGGGTT CGAAATGACC GACCAAGCGA 

CCACCGCCGC CTTCTATGAA AGGTTGGGCT 
TGATCCTCCA GCGCGGGGAT CTCATGCTGG 

20 

CAGCTTATAA TGGTTACAAA TJ^AAGCAATA 
TTTCACTGCA TTCTAGTTGT GGTTTGTCCA 
TACCGTCGAC CTCTAGCTAG AGCTTGGCGT 

25 

ATTGTTATCC GCTCACAATT CCACACAACA 
GGGGTGCCTA ATGAGTGAGC TAACTCACAT 
30 AGTCGGGAAA CCTGTCGTGC CAGCTGCATT 

GTTTGCGTAT TGGGCGCTCT TCCGCTTCCT 
GGCTGCGGCG AGCGGTATCA GCTCACTCAA 

35 

GGGATAACGC AGGAAAGAAC ATGTGAGCAA 
AGGCCGCGTT GCTGGCGTTT TTCCATAGGC 
GACGCTCAAG TCAGAGGTGG CGAAACCCGA 

40 

CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC 
CCTTTCTCCC TTCGGGAAGC GTGGCGCTTT 
45 CGGTGTAGGT CGTTCGCTCC AAGCTGGGCT 

GCTGCGCCTT ATCCGGTAAC TATCGTCTTG 
CACTGGCAGC AGCCACTGGT AACAGGATTA 
AGTTCTTGAA GTGGTGGCCT AACTACGGCT 
CTCTGCTGAA GCCAGTTACC TTCGGAAAAA 



AAACATCGCA TCGAGCGAGC ACGTACTCGG 462 0 

CTGGACGAAG AGCATCAGGG GCTCGCGCCA 4680 

ATGCCCGACG GCGAGGATCT CGTCGTGACC 474 0 

GTGGAAAATG GCCGCTTTTC TGGATTCATC 4800 

TATCAGGACA TAGCGTTGGC TACCCGTGAT 4860 

GACCGCTTCC TCGTGCTTTA CGGTATCGCC 4920 

CGCCTTCTTG ACGAGTTCTT CTGAGCGGGA 4980 

CGCCCAACCT GCCATCACGA GATTTCGATT 5040 

TCGGAATCGT TTTCCGGGAC GCCGGCTGGA 5100 

AGTTCTTCGC CCACCCCAAC TTGTTTATTG 5160 

GCATCACAAA TTTCACAAAT AAAGCATTTT 5220 

AACTCATCAA TGTATCTTAT CATGTCTGTA 52 80 

AATCATGGTC ATAGCTGTTT CCTGTGTGAA 534 0 

TACGAGCCGG AAGCATAAAG TGTAAAGCCT 54 00 

TAATTGCGTT GCGCTCACTG CCCGCTTTCC 54 60 

AATGAATCGG CCAACGCGCG GGGAGAGGCG 5520 

CGCTCACTGA CTCGCTGCGC TCGGTCGTTC 5580 

AGGCGGTAAT ACGGTTATCC ACAGAATCAG 5640 

AAGGCCAGCA AAAGGCCAGG AACCGTAAAA 5700 

TCCGCCCCCC TGACGAGCAT CACAAAAATC 5760 

CAGGACTATA AAGATACCAG GCGTTTCCCC 5820 

CGACCCTGCC GCTTACCGGA TACCTGTCCG 5880 

CTCAATGCTC ACGCTGTAGG TATCTCAGTT 5940 

GTGTGCACGA ACCCCCCGTT CAGCCCGACC 6000 

AGTCCAACCC GGTAAGACAC GACTTATCGC 6060 

GCAGAGCGAG GTATGTAGGC GGTGCTACAG 6120 

ACACTAGAAG GACAGTATTT GGTATCTGCG 6180 

GAGTTGGTAG CTCTTGATCC GGCAAACAAA 6240 
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CCACCGCTGG TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA GATTACGCGC AGAAAAAAAG 63 00 

GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA CGCTCAGTGG AACGAAAACT 6360 

CACGTTAAGG GATTTTGGTC ATGAGATTAT CAAAAAGGAT CTTCACCTAG ATCCTTTTAA 64 20 

ATTAAAAATG AAGTTTTAAA TCAATCTAAA GTATATATGA GTAAACTTGG TCTGACAGTT 64 80 

ACCAATGCTT AATCAGTGAG GCACCTATCT CAGCGATCTG TCTATTTCGT TCATCCATAG 6540 

TTGCCTGACT CCCCGTCGTG TAGATAACTA CGATACGGGA GGGCTTACCA TCTGGCCCCA 6600 

GTGCTGCAAT GATACCGCGA GACCCACGCT CACCGGCTCC AGATTTATCA GCAATAAACC 6660 

AGCCAGCCGG AAGGGCCGAG CGCAGAAGTG GTCCTGCAAC TTTATCCGCC TCCATCCAGT 6720 

CTATTAATTG TTGCCGGGAA GCTAGAGTAA GTAGTTCGCC AGTTAATAGT TTGCGCAACG 6780 

20 TTGTTGCCAT TGCTACAGGC ATCGTGGTGT CACGCTCGTC GTTTGGTATG GCTTCATTCA 6840 

GCTCCGGTTC CCAACGATCA AGGCGAGTTA CATGATCCCC CATGTTGTGC AAAAAAGCGG 6900 

TTAGCTCCTT CGGTCCTCCG ATCGTTGTCA GAAGTAAGTT GGCCGCAGTG TTATCACTCA 6960 

TGGTTATGGC AGCACTGCAT AATTCTCTTA CTGTCATGCC ATCCGTAAGA TGCTTTTCTG 7020 

TGACTGGTGA GTACTCAACC AAGTCATTCT GAGAATAGTG TATGCGGCGA CCGAGTTGCT 7080 

CTTGCCCGGC GTCAATACGG GATAATACCG CGCCACATAG CAGAACTTTA AAAGTGCTCA 714 0 

TCATTGGAAA ACGTTCTTCG GGGCGAAAAC TCTCAAGGAT CTTACCGCTG TTGAGATCCA 7200 

GTTCGATGTA ACCCACTCGT GCACCCAACT GATCTTCAGC ATCTTTTACT TTCACCAGCG 7260 

TTTCTGGGTG AGCAAAAACA GGAAGGCAAA ATGCCGCAAA AAAGGGAATA AGGGCGACAC 73 20 

GGAAATGTTG AATACTCATA CTCTTCCTTT TTCAATATTA TTGAAGCATT TATCAGGGTT 73 80 

ATTGTCTCAT GAGCGGATAC ATATTTGAAT GTATTTAGAA AAATAAACAA ATAGGGGTTC 7440 

CGCGCACATT TCCCCGAAAA GTGCCACCTG ACGTC 74 75 
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(2) INFORMATION ZU SEQ ID NO: 36: 



(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 8192 Basenpaare 

(B) ART: Nukleins^ure 

(C) STRANGFORM: Einzel 
50 (D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 
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(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .8192 



(xi) SEQUEN2BBSCHREIBUNG: SEQ ID NO : 36: 

GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC TGCTCTGATG 60 

CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT GGAGGTCGCT GAGTAGTGCG 120 

CGAGCAAAAT TTAAGCTACA ACAAGGCAAG GCTTGACCGA CAATTGCATG AAGAATCTGC 180 

TTAGGGTTAG GCGTTTTGCG CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT 240 

GATTATTGAC TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA 3 00 

TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG CCCAACGACC 360 

CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT AACGCCAATA GGGACTTTCC 420 

ATTGACGTCA ATGGGTGGAC TATTTACGGT AAACTGCCCA CTTGGCAGTA CATCAAGTGT 4 80 

ATCATATGCC AAGTACGCCC CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT 540 

ATGCCCAGTA CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 600 

TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA TAGCGGTTTG 660 

ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA TGGGAGTTTG mTGGCACC 720 

AAAATCAACG GGACTTTCCA AAATGTCGTA ACAACTCCGC CCCATTGACG CAAATGGGCG 780 

GTAGGCGTGT ACGGTGGGAG GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA 84 0 

35 CTGCTTACTG GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC . 900 

GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT GCAGAATTCG 960 

GCTTGGGATG ACGCCTCCTC CGCCCGGACG TGCCGCCCCC AGCGCACCGC GCGCCCGCGT 102 0 

CCCTGGCCCG CCGGCTCGGT TGGGGCTTCC GCTGCGGCTG CGGCTGCTGC TGCTGCTCTG 1080 

GGCGGCCGCC GCCTCCGCCC AGGGCCACCT AAGGAGCGGA CCCCGCATCT TCGCCGTCTG 114 0 

GAAAGGCCAT GTAGGGCAGG ACCGGGTGGA CTTTGGCCAG ACTGAGCCGC ACACGGTGCT 1200 
TTTCCACGAG CCAGGCAGCT CCTCTGTGTG GGTGGGAGGA CGTGGCAAGG TCTACCTCTT ' 1260 

TGACTTCCCC GAGGGCAAGA ACGCATCTGT GCGCACGGTG AATATCGGCT CCACAAAGGG 1320 

50 GTCCTGTCTG GATAAGCGGG ACTGCGAGAA CTACATCACT CTCCTGGAGA GGCGGAGTGA 1380 

GGGGCTGCTG GCCTGTGGCA CCAACGCCCG GCACCCCAGC TGCTGGAACC TGGTGAATGG 1440 
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CACTGTGGTG 


CCACTTGGCG 


AGATGAGAGG 




1 1 WAot-t-CGG 


ACGAGAACTC 


1500 


5 


CCTGGTTCTG 


TTTGAAGGGG 


ACGAGGTGTA 




L tiO AAGCAGG 


AATACAATGG 


1560 




GAAGATCCCT 


CGGTTCCGCC 


GCATCCGGGG 


CG AG AriTr: a n 


U 1 1 AL. AC CA 


GTGATACTGT 


1620 




CATGCAGAAC 


CCACAGTTCA 


TCAAAGCCAC 


CATCGTCCAP 


p A A a ^^f' a /"v 


CTTACGATGA 


1680 


10 


CAAGATCTAC 


TACTTCTTCC 


GAGAGGACAA 


TO CTG ACAAG 




CTCCTCTCAA 


1740 




TGTGTCCCGT 


GTGGCCCAGT 


TGTGCAGGGG 


GGACCAGGGT 




CACTGTCAGT 


1800 




CTCCAAGTGG 


AACACTTTTC 


TGAAAGCCAT 


GCTGGTATGC 




CCACCAACAA 


1860 


15 


GAACTTCAAC 


AGGCTGCAAG 


ACGTCTTCCT 


GCTCCCTGAC 


CPPAPPPPPP 


AO i uVj AuvjG A 


1920 




CACCAGGGTC 


TATGGTGTTT 


TCTCCAACCC 


CTGGAACTAC 


TPAnPPPTPT 


i U lAj i A I 1 L 


1980 


20 


CCTCGGTGAC 


ATTGACAAGG 


TCTTCCGTAC 


CTCCTCACTC 


AA PnfJPT A PP 


AC i CAAUCLTT 


2040 


TCCCAACCCG 


CGGCCTGGCA 


AGTGCCTCCC 


AGACCAGCAG 


PPn AT APPPA 


C Avj Atj AC t-TT 


2100 




CCAGGTGGCT 


GACCGTCACC 


CAGAGGTGGC 


GCAGAGGGTG 


GAGC CPATCn 


PnPPTPTY^a a 
vvjCC L C xvjAA 


2160 


25 


GACGCCATTG 


TTCCACTCTA 


AATACCACTA 


CCAGAAAGTG 


GPpriTTP a pp 


(jCA IAjCAAGC 


2220 




CAGCCACGGG 


GAGACCTTTC 


ATGTGCTTTA 


CCTAACTAPA 


ij>i^j\Ov7VAjv-A 


CTATCCACAA 


2280 




GGTGGTGGAA 


CCGGGGGAGC 


AGGAGCACAG 


V. 1 1 w Ok. ^ i i V. 


a a a a t^v^ 
AAUA i C A 1 


AG ATC CAGC C 


2340 


30 


CTTCCGCCGC 


GCGGCTGCCA 


TCCAGACCAT 


VJ i \_Vjv^ 1 VjoA 1 


UCTG AG CGGA 


GGAAGCTGTA 


2400 




TGTGAGCTCC 


CAGTGGGAGG 


TGAGCCAGGT 




TGTUTG AGG 


TCTATGG CGG 


2460 


35 


GGGCTGCCAC 


GGTTGCCTCA 


TGTCCCGAGA 






AGGGCCGCTG 


2520 


CATCTCCATC 


TACAGCTCCG 


AACGGTCAGT 


GPrnpAATPp 


ATTa aTr^r'a/^ 


C CGAGCCACA 


2580 




CAAGGAGTGT 


CCCAACCCCA 


AACCAGACAA 




V,>\OMAoVj 111 


CCCTGGCCCC 


2640 


40 


AAACTCTCGC 


TACTACCTGA 


GCTGCCCCAT 


GPAATPPPrtP 


a or* a r*r^»T* 
L. AV^vjV. L AC L.T 


ACTCATGGCG 


2700 




CCACAAGGAG 


AACGTGGAGC 


AGAGCTGCGA 


AP PTPfiTP A P 


V- Ava AOt. C L L. A 


ACTG CATCCT 


2760 




GTTCATCGAG 


AACCTCACGG 


CGCAGCAGTA 


PGnPPAPTAP 


1 1 L. I^jUGAOVj 


CCCAGGAGGG 


2820 


45 


CTCCTACTTC 


CGCGAGGCTC 


AGCACTGGCA 


GcrnPTnppp 


p a rs/^ a p/T/^ a 


TCATGGCCGA 


2880 




GCACCTGCTG 


GGTCATGCCT 


GTGCCCTGGC 


TGPPTPPPTP 




TGCTGCCCAC 


2940 




ACTCACTCTT 


GGCTTGCTGG 


TCCACATGGT 


GAGCAAGGGC 


GAGGAGCTGT 


TCACCGGGGT 


3000 


50 


GGTGCCCATC 


CTGGTCGAGC 


TGGACGGCGA 


CGTAAACGGC 


CACAAGTTCA 


GCGTGTCCGG 


3060 




CGAGGGCGAG 


GGCGATGCCA 


CCTACGGCAA 


GCTGACCCTG 


AAGTTCATCT 


GCACCACCGG 


3120 
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CAAGCTGCCC GTGCCCTGGC CCACCCTCGT 
CAGCCGCTAC CCCGACCACA TGAAGCAGCA 

5 

CTACGTCCAG GAGCGCACCA TCTTCTTCAA 
GGTGAAGTTC GAGGGCGACA CCCTGGTGAA 
10 GGAGGACGGC AACATCCTGG GGCACAAGCT 

TATCATGGCC GACAAGCAGA AGAACGGCAT 
GGAGGACGGC AGCGTGCAGC TCGCCGACCA 

15 

CCCCGTGCTG CTGCCCGACA ACCACTACCT 
CAACGAGAAG CGCGATCACA TGGTCCTGCT 
CGGCATGGAC GAGCTGTACA AGGTGAAGCT 

20 

GOATCTOP AT AGGGGCGTCG ACCATCATCA 
GCCTCGACTG TGCCTTCTAG TTGCCAGCCA 
TTGACCCTGG AAGGTGCCAC TCCCACTGTC 
CATTGTCTGA GTAGGTGTCA TTCTATTCTG 
GAGGATTGGG AAGACAATAG CAGGCATGCT 

30 

GCGGAAAGAA CCAGCTGGGG CTCTAGGGGG 
AGCGCGGCGG GTGTGGTGGT TACGCGCAGC 
35 CCCGCTCCTT TCGCTTTCTT CCCTTCCTTT 

GCTCTAAATC GGGGCATCCC TTTAGGGTTC 
AAAAAACTTG ATTAGGGTGA TGGTTCACGT 

40 

CGCCCTTTGA CGTTGGAGTC CACGTTCTTT 
ACACTCAACC CTATCTCGGT CTATTCTTTT 
TATTGGTTAA AAAATGAGCT GATTTAACAA 

45 

TGTGTCAGTT AGGGTGTGGA AAGTCCCCAG 
ATGCATCTCA ATTAGTCAGC AACCAGGTGT 
50 AGTATGCAAA GCATGCATCT CAATTAGTCA 

ATCCCGCCCC TAACTCCGCC CAGTTCCGCC 



GACCACCCTG ACCTACGGCG TGCAGTGCTT 3180 

CGACTTCTTC AAGTCCGCCA TGCCCGAAGG 3240 

GGAGGACGGC AACTACAAGA CCCGCGCCGA 3300 

CCGCATCGAG CTGAAGGGCA TCGACITCAA 3360 

GGAGTACAAC TACAACAGCC ACAACGTCTA 3420 

CAAGGTGAAC TTCAAGATCC GCCACAACAT 34 80 

CTACCAGCAG AACACCCCCA TCGGCGACGG 354 0 

GAGCACCCAG TCCGCCCTGA GCAAAGACCC 3600 

GGAGTTCGTG ACCGCCGCCG GGATCACTCT 3660 

TGGGCCCGAA CAAAAACTCA TCTCAGAAGA 3720 

TCATCATCAT TGAGTTTAAA CCGCTGATCA 3780 

TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC 3 84 0 

CTTTCCTAAT AAAATGAGGA AATTGCATCG 3900 

GGGGGTGGGG TGGGGCAGGA CAGCAAGGGG 3960 

GGGGATGCGG TGGGCTCTAT GGCTTCTGAG 4 020 

TATCCCCACG CGCCCTGTAG CGGCGCATTA 4 080 

GTGACCGCTA CACTTGCCAG CGCCCTAGCG 4140 

CTCGCCACGT TCGCCGGCTT TCCCCGTCAA 4200 

CGATTTAGTG CTTTACGGCA CCTCGACCCC 4 260 

AGTGGGCCAT CGCCCTGATA GACGGTTTTT 4320 

AATAGTGGAC TCTTGTTCCA AACTGGAACA 4 3 80 

GATTTATAAG GGATTTTGGG GATTTCGGCC 444 0 

AAATTTAACG CGAATTAATT CTGTGGAATG 4 500 

GCTCCCCAGG CAGGCAGAAG TATGCAAAGC 4560 

GGAAAGTCCC CAGGCTCCCC AGCAGGCAGA 4620 

GCAACCATAG TCCCGCCCCT AACTCCGCCC 4 680 

CATTCTCCGC CCCATGGCTG ACTAATTTTT 4 740 
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TTTATTTATG 


! CAGAGGCCGA GGCCGCCTCT GCCTCTGAGC TATTCCAGAA GTAGTGAGGA 


4 oQU 


5 


GGCTTTTTTG 


! GAGGCCTAGG 


r ^- 1 1 1-iGCAAA AAGCTCCCGG GAGCTTGTAT ATCCATTTTC 


4 860 




GGATCTGATC 


AAGAGACAGG 


ATGAGGATCG 


I TTTCGCATGA TTGAACAAGA TGGATTGCAC 






GCAGGTTCTC 


CGGCCGCTTG 


GGTGGAGAGG 


i CTATTCGGCT ATGACTGGGC ACAACAGACA 


AOQf\ 


10 


ATCGGCTGCT 


CTGATGCCGC 


CGTGTTCCGG 


CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT 






GTCAAGACCG 


ACCTGTCCGG 


TGCCCTGAAT 


GAACTGCAGG ACGAGGCAGC GCGGCTATCG 


5100 




TGGCTGGCCA 


CGACGGGCGT 


TCCTTGCGCA 


GCTGTGCTCG ACGTTGTCAC TGAAGCGGGA 


5160 


15 


AGGGACTGGC 


TGCTATTGGG 


CGAAGTGCCG 


GGGCAGGATC TCCTGTCATC TCACCTTGCT 


5220 




CCTGCCGAGA 


AAGTATCCAT 


CATGGCTGAT 


GCAATGCGGC GGCTGCATAC GCTTGATCCG 


5280 


20 


GCTACCTGCC 


CATTCGACCA 


CCAAGCGAAA 


CATCGCATCG AGCGAGCACG TACTCGGATG 


5340 


GAAGCCGGTC 


TTGTCGATCA 


GGATGATCTG 


GACGAAGAGC ATCAGGGGCT CGCGCCAGCC 


54 00 




GAACTGTTCG 


CCAGGCTCAA 


GGCGCGCATG 


CCCGACGGCG AGGATCTCGT CGTGACCCAT 


5460 


25 


GGCGATGCCT 


GCTTGCCGAA 


TATCATGGTG 


GAAAATGGCC GCTTTTCTGG ATTCATCGAC 


5520 




TGTGGCCGGC 


TGGGTGTGGC 


GGACCGCTAT 


CAGGACATAG CGTTGGCTAC CCGTGATATT 


5580 




GCTGAAGAGC 


TTGGCGGCGA 


ATGGGCTGAC 


CGCTTCCTCG TGCTTTACGG TATCGCCGCT 




30 


CCCGATTCGC 


AGCGCATCGC 


CTTCTATCGC 


CTTCTTGACG AGTTCTTCTG AGCGGGACTC 


^ TOfl 

3 / V V 




TGGGGTTCGA 


AATGACCGAC 


CAAGCGACGC 


CCAACCTGCC ATCACGAGAT TTCGATTCCA 


5760 




CCGCCGCCTT 


CTATGAAAGG 


TTGGGCTTCG 


GAATCGTTTT CCGGGACGCC GGCTGGATGA 


5820 


35 


TCCTCCAGCG 


CGGGGATCTC 


ATGCTGGAGT 


TCTTCGCCCA CCCCAACTTG TTTATTGCAG 


5880 




CTTATAATGG 


TTACAAATAA 


AGCAATAGCA 


TCACAAATTT CACAAATAAA GCATTTTTTT 


5940 


40 


CACTGCATTC 


TAGTTGTGGT 


TTGTCCAAAC 


TCATCAATGT ATCTTATCAT. GTCTGTATAC 


6000 


CGTCGACCTC 


TAGCTAGAGC 


TTGGCGTAAT 


CATGGTCATA GCTGTTTCCT GTGTGAAATT 


6060 




GTTATCCGCT 


CACAATTCCA 


CACAACATAC 


GAGCCGGAAG CATAAAGTGT AAAGCCTGGG 


6120 


45 


GTGCCTAATG 


AGTGAGCTAA 


CTCACATTAA 


TTGCGTTGCG CTCACTGCCC GCTTTCCAaT 


6180 




CGGGAAACCT 


GTCGTGCCAG 


CTGCATTAAT 


GAATCGGCCA ACGCGCGGGG AGAGGCGGTT 


6240 




TGCGTATTGG 


GCGCTCTTCC 


GCTTCCTCGC 


TCACTGACTC GCTGCGCTCG GTCGTTCGGC 


6300 


50 


TGCGGCGAGC GGTATCAGCT 


CACTCAAAGG 


CGGTAATACG GTTATCCACA GAATCAGGGG 


6360 




ATAACGCAGG 


AAAGAACATG 


TGAGCAAAAG 


GCCAGCAAAA GGCCAGGAAC CGTAAAAAGG 


6420 
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AATGTTGAAT ACTCATACTC TTCCTTTTTC AATATTATTG AAGCATTTAT CAGGGTTATT 
GTCTCATGAG CGGATACATA TTTGAATGTA TTTAGAAAAA TAAACAAATA GGGGTTCCGC 
GCACATTTCC CCGAAAAGTG CCACCTGACG TC 

(2) INFORMATION ZU SEQ ID NO: 37: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGB: 7000 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 
<B) LAGE: 1. .7000 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 37: 
AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT TGTTCTCGTT 
AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC GATGGACAAG TGCATTGTTC 
TCTTGCTGAA AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC AGTACCCGGG 
AGTACCCTCG ACCGCCGGAG TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT 
TCAAACAAGC AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 
GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA AAAGTAACCA 
GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA GAAGTAATTA TTGAATACAA 
GAAGAGAACT CTGAATACTT TCAACAAGTT ACCGAGAAAG AAGAACTCAC ACACAGCTAG 
CGTTTAAACT TAAGCTTGGT ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGGAATTCGG 
CTTGGGATGA CGCCTCCTCC GCCCGGACGT GCCGCCCCCA GCGCACCGCG CGCCCGCGTC 
CCTGGCCCGC CGGCTCGGTT GGGGCTTCCG CTGCGGCTGC GGCTGCTGCT GCTGCTCTGG 
GCGGCCGCCG CCTCCGCCCA GGGCCACCTA AGGAGCGGAC CCCGCATCTT CGCCGTCTGG 
AAAGGCCATG TAGGGCAGGA CCGGGTGGAC TTTGGCCAGA CTGAGCCGCA CACGGTGCTT 
TTCCACGAGC CAGGCAGCTC CTCTGTGTGG GTGGGAGGAC GTGGCAAGGT CTACCTCTTT 
GACTTCCCCG AGGGCAAGAA CGCATCTGTG CGCACGGTGA ATATCGGCTC CACAAAGGGG 
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TCCTGTCTGG ATAAGCGGGA CTGCGAGAAC 
GGGCTGCTGG CCTGTGGCAC CAACGCCCGG 

5 

ACTGTGGTGC CACTTGGCGA GATGAGAGGC 
CTGGTTCTGT TTGAAGGGGA CGAGGTGTAT 
AAGATCCCTC GGTTCCGCCG CATCCGGGGC 

10 

ATGCAGAACC CACAGTTCAT CAAAGCCACC 
AAGATCTACT ACTTCTTCCG AGAGGACAAT 
15 GTGTCCCGTG TGGCCCAGTT GTGCAGGGGG 

TCCAAGTGGA ACACTTTTCT GAAAGCCATG 
AACTTCAACA GGCTGCAAGA CGTCTTCCTG 

20 

ACCAGGGTCT ATGGTGTTTT CTCCAACCCC 
CTCGGTGACA TTGACAAGGT CTTCCGTACC 
CCCAACCCGC GGCCTGGCAA GTGCCTCCCA 

25 

CAGGTGGCTG ACCGTCACCC AGAGGTGGCG 
ACGCCATTGT TCCACTCTAA ATACCACTAC 
30 AGCCACGGGG AGACCTTTCA TGTGCTTTAC 

GTGGTGGAAC CGGGGGAGCA GGAGCACAGC 
TTCCGCCGCG CGGCTGCCAT CCAGACCATG 

35 

GTGAGCTCCC AGTGGGAGGT GAGCCAGGTG 
GGCTGCCACG GTTGCCTCAT GTCCCGAGAC 
ATCTCCATCT ACAGCTCCGA ACGGTCAGTG 

40 

AAGGAGTGTC CCAACCCCAA ACCAGACAAG 
AACTCTCGCT ACTACCTGAG CTGCCCCATG 
45 CACAAGGAGA ACGTGGAGCA GAGCTGCGAA 

TTCATCGAGA ACCTCACGGC GCAGCAGTAC 
TCCTACTTCC GCGAGGCTCA GCACTGGCAG 
CACCTGCTGG GTCATGCCTG TGCCCTGGCT 
CTCACTCTTG GCTTGCTGGT CCACGTGAAG 



TACATCACTC TCCTGGAGAG GCGGAGTGAG 960 

CACCCCAGCT GCTGGAACCT GGTGAATGGC 1020 

TACGCCCCCT TCAGCCCGGA CGAGAACTCC 1080 

TCCACCATCC GGAAGCAGGA ATACAATGGG 1140 

GAGAGTGAGC TGTACACCAG TGATACTGTC 1200 

ATCGTGCACC AAGACCAGGC TTACGATGAC 1260 

CCTGACAAGA ATCCTGAGGC TCCTCTCAAT 1320 

GACCAGGGTG GGGAAAGTTC ACTGTCAGTC 1380 

CTGGTATGCA GTGATGCTGC CACCAACAAG 1440 

CTCCCTGACC CCAGCGGCCA GTGGAGGGAC 1500 

TGGAJVCTACr CAGCCGTCTG TGTGTATTCC 1560 

TCCTCACTCA AGGGCTACCA CTCAAGCCTT 1620 

GACCAGCAGC CGATACCCAC AGAGACCTTC 1680 

CAGAGGGTGG AGCCCATGGG GCCTCTGAAG 174 0 

CAGAAAGTGG CCGTTCACCG CATGCAAGCC 1800 

CTAACTACAG ACAGGGGCAC TATCCACAAG 1860 

TTCGCCTTCA ACATCATGGA GATCCAGCCC 1920 

TCGCTGGATG CTGAGCGGAG GAAGCTGTAT 1980 

CCCCTGGACC TGTGTGAGGT CTATGGCGGG 2040 

CCCTACTGCG GCTGGGACCA GGGCCGCTGC 2100 

CTGCAATCCA TTAATCCAGC CGAGCCACAC 2160 

GCCCCACTGC AGAAGGTTTC CCTGGCCCCA 222 0 

GAATCCCGCC ACGCCACCTA CTCATGGCGC 2280 

CCTGGTCACC AGAGCCCCAA CTGCATCCTO 234 0 

GGCCACTACT TCTGCGAGGC CCAGGAGGGC 2400 

CTGCTGCCCG AGGACGGCAT CATGGCCGAG 2460 

GCCTCCCTCT GGCTGGGGGT GCTGCCCACA 2 520 

CTTGGGCCCG TTTAAACCCG CTGATCAGCC 258 0 



10 



15 



25 



30 



50 



264a 
2700 



EP 0 892 047 A2 

TCGACTGTGC CTTCTAGTTG CCAGCCATCT GTTGTTTCCC CCTCCCCCGT GCCrrCCTTC 
ACCCTGGAAG GTGCCACTCC CACTGTCCTT TCCTAATAAA ATGAGGAAAT TCCATCGCAT 

TGTCTGAGTA GGTGTCATTC TATTCTGGGG GGTGGGGTGG GGCAGGACAG CAAGGGGGAG 2760 

GATTGGGAAG ACAATAGCAG GCATGCTGGG GATGCGGTGG GCTCTATGGC TTCTGAGGCG 2820 

GAAAGAACCA GCTGGGGCTC TAGGGGGTAT CCCCACGCGC CCTGTAGCGG CGCATTAAGC 2880 

GCGGCGGGTG TGGTGGTTAC GCGCAGCX3TG ACCGCTACAC TTGCCAGCGC CCTAGCGCCC 294 0 

GCTCCTTTCG CTTTCTTCCC TTCCTTTCTC GCCACGTTCG CCGGCTITCC CCGTCAAGCT 3000 

CTAAATCGGG GCATCCCTTT AGGGTTCCGA TTTAGTGCTT TACGGCACCT CGACCCCAAA 3060 

AAACTTGATT AGGGTGATGG TTCACGTAGT GGGCCATCGC CCTGATAGAC GGTTTrTCGC 312 0 

^ CCTTTGACGT TGGAGTCCAC GTTCTTTAAT AGTGGACTCT TGTTCCAAAC TGGAACAACA 3180 

CTCAACCCTA TCTCGGTCTA TTCTTTTGAT TTATAAGGGA TTTTGGGGAT TTCGGCCTAT 3240 

TGGTTAAAAA ATGAGCTGAT TTAACAAAAA TTTAACGCGA ATTAATTCTG TGGAATCTGT 3300 

GTCAGTTAGG GTGTGGAAAG TCCCCAGGCT CCCCAGGCAG GCAGAAGTAT GCAAAGCATG 3360 

CATCTCAATT AGTCAGCAAC CAGGTGTGGA AAGTCCCCAG GCTCCCCAGC AGGCAGAAGT 342 0 

ATGCAAAGCA TGCATCTCAA TTAGTCAGCA ACCATAGTCC CGCCCCTAAC TCCGCCCATC 34 80 

CCGCCCCTAA CTCCGCCCAG TTCCGCCCAT TCTCCGCCCC ATGGCTGACT AATTTTTTTT 354 0 

ATTTATGCAG AGGCCGAGGC CGCCTCTGCC TCTGAGCTAT TCCAGAAGTA GTGAGGAGGC 3600 

35 TTTTTTGGAG GCCTAGGCTT TTGCAAAAAG CTCCCX3GGAG CTTGTATATC CATTTTCGGA 3660 

TCTGATCAAG AGACAGGATG AGGATCGTTT CGCATGATTG AACAAGATGG ATTGCACGCA 3720 

GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA TTCGGCTATG ACTGGGCACA ACAGACAATC 3780 

40 

GGCTGCTCTG ATGCCGCCGT GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC 3840 

..AAGACCGACC TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG GCTATCGTGG 3900 

CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA AGCGGGAAGG 3960 

GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC TCTCATCTCA CCTTGCTCCT 4020 

GCCGAGAAAG TATCCATCAT GGCTGATGCA ATGCGGCGGC TGCATACGCT TGATCCGGCT 4080 

ACCTGCCCAT TCGACCACCA AGCGAAACAT CGCATCGAGC GAGCACGTAC TCGGATGGAA 414 0 

GCCGGTCTTG TCGATCAGGA TGATCTGGAC GAAGAGCATC AGGGGCTCGC GCCAGCCGAA 4200 
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CTGTTCGCCA GGCTCAAGGC GCGCATGCCC 
GATGCCTGCT TGCCGAATAT CATGGTGGAA 

5 

GGCCGGCTGG GTGTGGCGGA CCGCTATCAG 
GAAGAGCTTG GCGGCGAATG GGCTGACCGC 
GATTCGCAGC GCATCGCCTT CTATCGCCTT 

W 

GGTTCGAAAT GACCGACCAA GCGACGCCCA 
CCGCCTTCTA TGAAAGGTTG GGCTTCGGAA 
15 TCCAGCGCGG GGATCTCATG CTGGAGTTCT 

ATAATGGTTA CAAATAAAGC AATAGCATCA 
TGCATTCTAG TTGTGGTTTG TCCAAACTCA 

20 

CGACCTCTAG CTAGAGCTTG GCGTAATCAT 
ATCCGCTCAC AATTCCACAC AACATACGAG 
CCTAATGAGT GAGCTAACTC ACATTAATTG 

25 

GAAACCTGTC GTGCCAGCTG CATTAATGAA 
GTATTGGGCG CTCTTCCGCT TCCTCGCTCA 
GGCGAGCGGT ATCAGCTCAC TCAAAGGCGG 
ACGCAGGAAA GAACATGTGA GCAAAAGGCC 
CGTTGCTGGC GTTTTTCCAT AGGCTCCGCC 
CAAGTCAGAG GTGGCGAAAC CCGACAGGAC 
GCTCCCTCGT GCGCTCTCCT GTTCCGACCC 
TCCCTTCGGG AAGCGTGGCG CTTTCTCAAT 

40 

AGGTCGTTCG CTCCAAGCTG GGCTGTGTGC 
CCTTATCCGG TAACTATCGT CTTGAGTCCA 
CAGCAGCCAC TGGTAACAGG ATTAGCAGAG 

40 

TGAAGTGGTG GCCTAACTAC GGCTACACTA 
TGAAGCCAGT TACCTTCGGA AAAAGAGTTG 
50 CTGGTAGCGG TGGTmTTT GTTTGCAAGC 

AAGAAGATCC TTTGATCTTT TCTACGGGGT 



GACGGCGAGG ATCTCGTCGT GACCCATGGC 42 60 

AATGGCCGCT TTTCTGGATT CATCGACTGT 4 320 

GACATAGCGT TGGCTACCCG TGATATTGCT 43 80 

TTCCTCGTGC TTTACGGTAT CGCCGCTCCC 444 0 

CTTGACGAGT TCTTCTGAGC GGGACTCTGG 4500 

ACCTGCCATC ACGAGATTTC GATTCCACCG 4560 

TCGTTTTCCG GGACGCCGGC TGGATGATCC 4620 

TCGCCCACCC CAACTTGTTT ATTGCAGCTT 4680 

CAAATTTCAC AAATAAAGCA TTTTTTTCAC 4740 

TCAATGTATC TTATCATGTC TGTATACCGT 4 800 

GGTCATAGCT GTTTCCTGTG TGAAATTGTT 4860 

CCGGAAGCAT AAAGTGTAAA GCCTGGGGTG 4920 

CGTTGCGCTC ACTGCCCGCT TTCCAGTCGG 4980 

TCGGCCAACG CGCGGGGAGA GGCGGTTTGC 504 0 

CTGACTCGCT GCGCTCGGTC GTTCGGCTGC 5100 

TAATACGGTT ATCCACAGAA TCAGGGGATA 5160 

AGCAAAAGGC CAGGAACCGT AAAAAGGCCG 5220 

CCCCTGACGA GCATCACAAA AATCGACGCT 5280 

TATAAAGATA CCAGGCGTTT CCCCCTGGAA 5340 

TGCCGCTTAC CGGATACCTG TCCGCCTTTC 5400 

GCTCACGCTG TAGGTATCTC AGTTCGGTGT 5460 

ACGAACCCCC CGTTCAGCCC GACCGCTGCG 5520 

ACCCGGTAAG ACACGACTTA TCGCCACTGG 5580 

CGAGGTATGT AGGCGGTGCT ACAGAGTTCT 5640 

GAAGGACAGT ATTTGGTATC TGCGCTCTGC 5700 

GTAGCTCTTG ATCCGGCAAA CAAACCACCG 5760 

AGCAGATTAC GCGCAGAAAA AAAGGATCTC 5820 

CTGACGCTCA GTGGAACGAA AACTCACGTT 5880 
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5 



15 



20 



25 



30 



35 



AAGGGATTTT 


GGTCATGAGA 


TTATCAAAAA 


GGATCTTCAC 


CTAGATCCTT 


TTAAATTAAA 


5 940 


AATGAAGTTT 


TAAATCAATC 


TAAAGTATAT 


ATGAGTAAAC 


TTGGTCTGAC 


AGTTACCAAT 


6000 


GCTTAATCAG 


TGAGGCACCT 


ATCTCAGCGA 


TCTGTCTATT 


TCGTTCATCC 


ATAGTTGCCT 


6060 


GACTCCCCGT 


CGTGTAGATA 


ACTACGATAC 


GGGAGGGCTT 


ACCATCTGGC 


CCCAGTGCTG 


6120 


CAATGATACC 


GCGAGACCCA 


CGCTCACCGG 


CTCCAGATTT 


ATCAGCAATA 


AACCAGCCAG 


6180 


CCGGAAGGGC 


CGAGCGCAGA 


AGTGGTCCTG 


CAACTTTATC 


CGCCTCCATC 


CAGTCTATTA 


6240 


ATTGTTGCCG 


GGAAGCTAGA 


GTAAGTAGTT 


CGCCAGTTAA 


TAGTTTGCGC 


AACGTTGTTG 


6300 


CCATTGCTAC 


AGGCATCGTG 


GTGTCACGCT 


CGTCGTTTGG 


TATGGCTTCA 


TTCAGCTCCG 


6360 


GTTCCCAACG 


ATCAAGGCGA 


GTTACATGAT 


CCCCCATGTT GTGCAAAAAA GCGGTTAGCT 


6420 


CCTTCGGTCC 


TCCGATCGTT 


GTCAGAAGTA 


AGTTGGCCGC 


AGTGTTATCA 


CTCATGGTTA 


6480 


TGGCAGCACT 


GCATAATTCT 


CTTACTGTCA 


TGCCATCCGT 


AAGATGCTTT 


TCTGTGACTG 


6540 


GTGAGTACTC 


AACCAAGTCA 


TTCTGAGAAT 


AGTGTATGCG 


GCGACCGAGT 


TGCTCTTGCC 


6600 


CGGCGTCAAT 


ACGGGATAAT 


ACCGCGCCAC 


ATAGCAGAAC 


TTTAAAAGTG 


CTCATCATTG 


6660 


GAAAACGTTC 


TTCGGGGCGA 


AAACTCTCAA 


GGATCTTACC 


GCTGTTGAGA 


TCCAGTTCGA 


6720 


TGTAACCCAC 


TCGTGCACCC 


AACTGATCTT 


CAGCATCTTT 


TACTTTCACC 


AGCGTTTCTG 


6780 


GGTGAGCAAA 


AACAGGAAGG 


CAAAATGCCG 


CAAAAAAGGG 


AATAAGGGCG 


ACACGGAAAT 


6840 


GTTGAATACT 


CATACTCTTC 


^ A A ^ ^ A ^ 


ATTATTGAAG 


CATTTATCAG 


GGTTATTGTC 


6900 


TCATGAGCGG 


ATACATATTT 


GAATGTATTT 


AGAAAAATAA 


ACAAATAGGG 


GTTCCGCGCA 


6960 


CATTTCCCCG 


AAAAGTGCCA 


CCTGACGTCG 


ACGGATCGGG 






7000 



40 (2) INFORMATION ZU SEQ ID NO: 38: 

(i) SEQUENZ CHARAKTERISTIKA: 
-r (A) LANGE: 7108 Basenpaare 

(B) ART: Nukleinsaure 
45 (C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 

50 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..7108 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 38: 

AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT TGTTCTCGTT 60 

5 

AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC GATGGACAAG TGCATTGTTC 120 

TCTTGCTGAA AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC AGTACCCGGG 180 

AGTACCCTCG ACCGCCGGAG TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT 24 0 

TCAAACAAGC AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 3 00 

GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA AAAGTAACCA 360 

15 

GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA GAAGTAATTA TTGAATACAA 420 

GAAGAGAACT CTGAATACTT TCAACAAGTT ACCGAGAAAG AAGAACTCAC ACACAGCTAG 4 80 

CGTTTAAACT TAAGCTTGGT ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGGAATTCGG 54 0 

20 

CTTGGGATGA CGCCTCCTCC GCCCGGACGT GCCGCCCCCA GCGCACCGCG CGCCCGCGTC 600 

CCTGGCCCGC CGGCTCGGTT GGGGCTTCCG CTGCGGCTGC GGCTGCTGCT GCTGCTCTGG 660 

25 GCGGCCGCCG CCTCCGCCCA GGGCCACCTA AGGAGCGGAC CCCGCATCTT CGCCGTCTGG 720 

AAAGGCCATG TAGGGCAGGA CCGGGTGGAC TTTGGCCAGA CTGAGCCGCA CACGGTGCTT 780 

TTCCACGAGC CAGGCAGCTC CTCTGTGTGG GTGGGAGGAC GTGGCAAGGT CTACCTCTTT 840 

30 

GACTTCCCCG AGGGCAAGAA CGCATCTGTG CGCACGGTGA ATATCGGCTC CACAAAGGGG 900 

TCCTGTCTGG ATAAGCGGGA CTGCGAGAAC TACATCACTC TCCTGGAGAG GCGGAGTGAG 960 

35 GGGCTGCTGG CCTGTGGCAC CAACGCCCGG CACCCCAGCT GCTGGAACCT GGTGAATGGC 1020 

ACTGTGGTGC CACTTGGCGA GATGAGAGGC TACGCCCCCT TCAGCCCGGA CGAGAACTCC 1080 

CTGGTTCTGT TTGAAGGGGA CGAGGTGTAT TCCACCATCC GGAAGCAGGA ATACAATGGG 1140 

AAGATCCCTC GGTTCCGCCG CATCCGGGGC GAGAGTGAGC TGTACACCAG TGATACTGTC 1200 

ATGCAGAACC CACAGTTCAT CAAAGCCACC ATCGTGCACC AAGACCAGGC TTACGATGAC 1260 

AAGATCTACT ACTTCTTCCG AGAGGACAAT CCTGACAAGA ATCCTGAGGC TCCTCTCAAT 1320 

45 

GTGTCCCGTG TGGCCCAGTT GTGCAGGGGG GACCAGGGTG GGGAAAGTTC ACTGTCAGTC 13 80 

TCCAAGTGGA ACACTTTTCT GAAAGCCATG CTGGTATGCA GTGATGCTGC CACCAACAAG 144 0 

50 AACTTCAACA GGCTGCAAGA CGTCTTCCTG CTCCCTGACC CCAGCGGCCA GTGGAGGGAC 1500 

ACCAGGGTCT ATGGTGTTTT CTCCAACCCC TGGAACTACT CAGCCGTCTG TGTGTATTCC 1560 
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CTCGGTGACA 


. TTGACAAGGT 


' CTTCCGTACC TCCTCACTCA AGGGCTACCA CTCAAGCCTT 


1620 


5 


CCCAACCCGC 


GGCCTGGCAA 


GTGCCTCCCA GACCAGCAGC CGATACCCAC AGAGACCTTC 


1680 




CAGGTGGCTG 


ACCGTCACCC 


AGAGGTGGCG CAGAGGGTGG AGCCCATGGG GCCTCTGAAG 


1740 




ACGCCATTGT 


TCCACTCTAA 


ATACCACTAC CAGAAAGTGG CCGTTCACCG CATGCAAGCC 


1800 


10 


AGCCACGGGG 


AGACCTTTCA 


TGTGCTTTAC CTAACTACAG ACAGGGGCAC TATCCACAAG 


1860 




GTGGTGGAAC 


CGGGGGAGCA 


GGAGCACAGC TTCGCCTTCA ACATCATGGA GATCCAGCCC 


1920 




TTCCGCCGCG 


-CGGCTGCCAT 


CCAGACCATG TCGCTGGATG CTGAGCGGAG GAAGCTGTAT 


1980 


15 


GTGAGCTCCC 


AGTGGGAGGT 


GAGCCAGGTG CCCCTGGACC TGTGTGAGGT CTATGGCGGG 


2040 




GGCTGCCACG 


GTTGCCTCAT 


GTCCCGAGAC CCCTACTGCG GCTGGGACCA GGGCCGCTGC 


2100 


20 


ATCTCCATCT 


ACAGCTCCGA 


ACGGTCAGTG CTGCAATCCA TTAATCCAGC CGAGCCACAC 


2160 


AAGGAGTGTC 


CCAACCCCAA 


ACCAGACAAG GCCCCACTGC AGAAGGTTTC CCTGGCCCCA 


2220 




AACTCTCGCT 


ACTACCTGAG 


CTGCCCCATG GAATCCCGCC ACGCCACCTA CTCATGGCGC 


2280 


25 


CACAAGGAGA 


ACGTGGAGCA 


GAGCTGCGAA CCTGGTCACC AGAGCCCCAA CTGCATCCTG 


2340 




TTCATCGAGA 


ACCTCACGGC 


GCAGCAGTAC GGCCACTACT TCTGCGAGGC CCAGGAGGGC 


2400 




TCCTACTTCC 


GCGAGGCTCA 


GCACTGGCAG CTGCTGCCCG AGGACGGCAT CATGGCCGAG 


2460 


30 


CACCTGCTGG 


GTCATGCCTG 


TGCCCTGGCT GCCTCCCTCT GGCTGGGGGT GCTGCCCACA 


2520 




CTCACTCTTG 


GCTTGCTGGT 


CCACGTGAAG CTTGGGCCCG AACAAAAACT CATCTCAGAA 


2580 




GAGGATCTGA 


ATAGCGCCGT 


CGACCATCAT CATCATCATC ATTGAGTTTA TCCAGCACAG 


2640 


35 


TGGCGGCCGC 


TCGAGTCTAG 


AGGGCCCGTT TAAACCCGCT GATCAGCCTC GACTGTGCCT 


2700 




TCTAGTTGCC 


AGCCATCTGT 


TGTTTGCCCC TCCCCCGTGC CTTCCTTGAC CCTGGAAGGT 


2760 


40 


GCCACTCCCA 


CTGTCCTTTC 


CTAATAAAAT GAGGAAATTG CATCGCATTG TCTGAGTAGG 


2820 




TGTCATTCTA 


TTCTGGGGGG 


TGGGGTGGGG CAGGACAGCA AGGGGGAGGA TTGGGAAGAC 


2880 




AATAGCAGGC 


ATGCTGGGGA 


TGCGGTGGGC TCTATGGCTT CTGAGGCGGA AAGAACCAGC 


2940 


45 


TGGGGCTCTA 


GGGGGTATCC 


CCACGCGCCC TGTAGCGGCG CATTAAGCGC GGCGGGTGTG 


3000 




GTGGTTACGC 


GCAGCGTGAC 


CGCTACACTT GCCAGCGCCC TAGCGCCCGC TCCTTTCGCT 


3060 




- TTCTTCCCTT 


CCTTTCTCGC 


CACGTTCGCC GGCTTTCCCC nTCAanrTrr AAis.Tnnnnrtn 


3120 


50 


ATCCCTTTAG 


GGTTCCGATT 


TAGTGCTTTA CGGCACCTCG ACCCCAAAAA ACTTGATTAG 


3180 




GGTGATGGTT 


CACGTAGTGG 


GCCATCGCCC TGATAGACGG TTTTTCGCCC TTTGACGTTG 


3240 
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GAGTCCACGT TCTTTAATAG TGGACTCTTG 
TCGGTCTATT CTTTTGATTT ATAAGGGATT 

5 

GAGCTGATTT AACAAAAATT TAACGCGAAT 
GTGGAAAGTC CCCAGGCTCC CCAGGCAGGC 
TCAGCAACCA GGTGTGGAAA GTCCCCAGGC 

10 

CATCTCAATT AGTCAGCAAC CATAGTCCCG 
CCGCCCAGTT CCGCCCATTC TCCGCCCCAT 
GCCGAGGCCG CCTCTGCCTC TGAGCTATTC 
CTAGGCTTTT GCAAAAAGCT CCCGGGAGCT 
ACAGGATGAG GATCGTTTCG CATGATTGAA 

20 

GCTTGOGTGG AGAGGCTATT CGGCTATGAC 
GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG 
25 TCCGGTGCCC TGAATGAACT GCAGGACGAG 

GGCGTTCCTT GCGCAGCTGT GCTCGACGTT 
TTGGGCGAAG TGCCGGGGCA GGATCTCCTG 

30 

TCCATCATGG CTGATGCAAT GCGGCGGCTG 
GACCACCAAG CGAAACATCG CATCGAGCGA 
GATCAGGATG ATCTGGACGA AGAGCATCAG 

35 

CTCAAGGCGC GCATGCCCGA CGGCGAGGAT 
CCGAATATCA TGGTGGAAAA TGGCCGCTTT 
GTGGCGGACC GCTATCAGGA CATAGCGTTG 
GGCGAATGGG CTGACCGCTT CCTCGTGCTT 
ATCGCCTTCT ATCGCCTTCT TGACGAGTTC 

45 

CCGACCAAGC GACGCCCAAC CTGCCATCAC 
AAAGGTTGGG CTTCGGAATC GTTTTCCGGG 
50 ATCTCATGCT GGAGTTCTTC GCCCACCCCA 

AATAAAGCAA TAGCATCACA AATTTCACAA 



TTCCAAACTG GAACAACACT CAACCCTATC 3300 

TTGGGGATTT CGGCCTATTG GTTAAAAAAT 3360 

TAATTCTGTG GAATGTGTGT CAGTTAGGGT 3420 

AGAAGTATGC AAAGCATGCA TCTCAATTAG 3480 

TCCCCAGCAG GCAGAAGTAT GCAAAGCATG 354 0 

CCCCTAACTC CGCCCATCCC GCCCCTAACT 3600 

GGCTGACTAA TTTTTTTTAT TTATGCAGAG 3 660 

CAGAAGTAGT GAGGAGGCTT TTTTGGAGGC 3 720 

TGTATATCCA TTTTCGGATC TGATCAAGAG 3780 

CAAGATGGAT TGCACGCAGG TTCTCCGGCC 3 840 

TGGGCACAAC AGACAATCGG CTGCTCTGAT 3 900 

CGCCCGGTTC TTTTTGTCAA GACCGACCTG 3960 

GCAGCGCGGC TATCGTGGCT GGCCACGACG 4020 

GTCACTGAAG CGGGAAGGGA CTGGCTGCTA 4080 

TCATCTCACC TTGCTCCTGC CGAGAAAGTA 4140 

CATACGCTTG ATCCGGCTAC CTGCCCATTC 4200 

GCACGTACTC GGATGGAAGC CGGTCTTGTC 4260 

GGGCTCGCGC CAGCCGAACT GTTCGCCAGG 4320 

CTCGTCGTGA CCCATGGCGA TGCCTGCTTG 4380 

TCTGGATTCA TCGACTGTGG CCGGCTGGGT 4440 

GCTACCCGTG ATATTGCTGA AGAGCTTGGC 4500 

TACGGTATCG CCGCTCCCGA TTCGCAGCGC 4560 
TTCTGAGCGG GACTCTGGGG TTCGAAATGA 4620 
GAGATTTCGA TTCCACCGCC GCCTTCTATG 4 680 
ACGCCGGCTG GATGATCCTC CAGCGCGGGG 474 0 
ACTTGTTTAT TGCAGCTTAT AATGGTTACA 4800 
ATAAAGCATT TTTTTCACTG CATTCTAGTT 4 860 
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cToorrrcTc c^ctcatc mtct.xc^ .rcrorcro tataccotco .cctctaoct 
ACAccrrccc ct;..tcatoo tcaxacc^t ttcc^tcx. 
rrcccAovA cat.coaocc oo;u.ccataa aotctm^oc cn^xx^^cc taa...c^ 
c^cTCAc .rr^^rrcco ^coerce .^ccocrrr ccAOTcaooA AAccax.coT 
- cccocTccA tt;u,.;..c cccc^uccco ccoocaccx. coot^ct A.n;cccccT 
CTTccccrrc crcocrccr o.ctccc..c ocxcootcct tcooctccco cc.occct.t 

COCTCACTC AAAOCCCX.TA ATACGOrTAT CCACACAATC AOOOOATAAC OCACCAAAOA 
ACATCTCACC AAAAOCCCAG CAAAAOOCCA COAACCOTAA AAACOCCOCC rrOCTOOCOT 

: rrrrccATAG cctccocccc cc^acoagc atcacaaaaa xcoacoctca aotcacaogt 

OCCCAAACCC OACAGCACTA TAAAGATACC AGOCCrrrcC CCCIXXJAAGC TCCCTCCTX.C 

ccTCTccTOT TccoAcccK. ccccrTACco CATAccT^xc ccccrrxcxc ccrrcccc^vA 

OCGXOGCGCX rrCTCAAXCC XCAC.CX..XA OGXAXCXCAG XTCGOXGXAG GXCGXXCGCT 
CCAAOCXGGG CXGTCXGCAC GAACCCCCCG rrCAGCCCGA CCGCXGCGCC XXAXTCGGXA 
ACXAXCGXCX XGAGXCCAAC CCGGXAAGAC ACGACTTAXC OCCACXGGCA GOVGCCACXX. 
OXAACAGGAX XAGCAGAGCG AGGXAXGXAG GCGGXGCXAC AGAGTrCTTG AAGX^XGGC 
CXAACXACGG CXACACXAGA AGGACAGXAX TI^XAXCXG CGCXC^cXG AAaCCAGT^-A 
CCrXCGGAAA AAGAGXXGGX AGCXCXXX^AX CCGGCAAACA AACCACCGCX GGXAGCGGTX. 

GrrrrxrrGx ^gcaagcag cagatxacgc gcagaaaaaa aggaxcxcaa gaagaxcctt 

TGAXCXrrxc XACGGGGXCX GACGCXCAGX GGAACGAAAA CXCACOrrAA GGGAXXXXGG 
TCAXGAGAXX AXCAAAAAGG AXCXTCACCX AGAXCCTTTr AAAITAAAAA XGAAGTTXXA 
AAXCAAXCXA AAGXAXAXAX GAGXAAACTX GGXCXGACAG XTACCAA^c TXAAXCAGTX. 
AGGCACCXAX CXCAGCGAXC XGXCTAmrC GXXCAXCCAX AGXXGCCXGA CXCCCCGXCG 
TGXAGAXAAC XACGAXACGG GAGGGCXTAC CAXCXGGCCC CAGXGCXGCA AXGAXACCGC 
OAGACCCACG CXCACCGGCX CCAGArrXAX CAGCAAXAAA CCAGCCAGCC GGAAGGGCCG 
AGCGCAGAAG t^XCCXGCA ACXXXAXCCG CCXCCAXCCA GXCXAXXAAX XGXX^CCGGG 
AAGCXAGAGX AAGXAGXXCG CCAGXXAAXA GTrXGCGCAA CGXXGrPoCC AX.3CXACAG 
GCAXCGXGGX GXCACGCXCG XCGrxXGGXA XGGCXXCAXX CAGCXCCGGX XCCCAACGAX 
CAAGGCGAGX XACAXGAXCC CCCAXGTTGX GCAAAAAAGC GGTTAGCXCC XXCGGXCCXC 



4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
6480 
6540 
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CGATCGTTGT CAGAAGTAAG TTGGCCGCAG TGTTATCACT CATGGTTATG GCAGCACTGC 
ATAATTCTCT TACTGTCATG CCATCCGTAA GATGCTTTTC TGTGACTGGT GAGTACTCAA 
CCAAGTCATT CTGAGAATAG TGTATGCGGC GACCGAGTTG CTCTTGCCCG GCGTCAATAC 
GGGATAATAC CGCGCCACAT AGCAGAACTT TAAAAGTGCT CATCATTGGA AAACGTTCTT 
CGGGGCGAAA ACTCTCAAGG ATCTTACCGC TGTTGAGATC CAGTTCGATG TAACCCACTC 
GTGCACCCAA CTGATCTTCA GCATCTTTTA CTTTCACCAG CGTTTCTGGG TGAGCAAAAA 
CAGGAAGGCA AAATGCCGCA AAAAAGGGAA TAAGGGCGAC ACGGAAATGT TGAATACTCA 
TACTCTTCCT TTTTCAATAT TATTGAAGCA TTTATCAGGG TTATTGTCTC ATGAGCGGAT 
ACATATTTGA ATGTATTTAG AAAAATAAAC AAATAGGGGT TCCGCGCACA TTTCCCCGAA 
AAGTGCCACC TGACGTCGAC GGATCGGG 

v2) IKFOkMATION ZU SEQ ID NO: 39: 

(i) SEQUEN2 CHARAKTERISTIKA : 

(A) LANGE: 4019 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..4019 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 39: 
CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT AATAGATTCA 
ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG AGGAGAAATT AACTATGAGA 
GGATCGCATC ACCATCACCA TCACGGATCC CTGGTTCTGT TTGAAGGGGA CGAGGTGTAT 
TCCACCATCC GGAAGCAGGA ATACAATGGG AAGATCCCTC GGTTCCGCCG CATCCGGGGC 
GAGAGTGAGC TGTACACCAG TGATACTGTC ATGCAGAACC CACAGTTCAT CAAAGCCACC 
ATCGTGCACC AAGACCAGGC TTACGATGAC AAGATCTACT ACTTCTTCCG AGAGGACAAT 
CCTGACAAGA ATCCTGAGGC TCCTCTCAAT GTGTCCCGTG TGGCCCAGTT GTGCAGGGGG 
GACCAGGGTG GGGAAAGTTC ACTGTCAGTC TCCAAGTGGA ACACTTTTCT GAAAGCCATG 
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CTGGTATGCA 


GTGATGCTGC 


CACCAACAAG 


AACTTCAACA 


GGCTGCAAGA 


CGTCTTCCTG 


540 


5 


CTCCCTGACC 


CCAGCGGCCA 


GTGGAGGGAC 


ACCAGGGTCT 


ATGGTGTTTT 


CTCCAACCCC 


600 




TGGAACTACT 


CAGCCGTCTG 


TGTGTATTCC 


CTCGGTGACA 


TTGACAAGGT 


CTTCCGTACC 


660 




TCCTCACTCA 


AGGGCTACCA 


CTCAAGCCTT 


CCCAACCCGC 


GGCCTGGCAA 


GTGCCTCCCA 


720 


10 


' GACCAGCAGC 


CGATACCCAC 


AGAAAGCTTA 


ATTAGCTGAG 


CTTGGACTCC 


TGTTGATAGA 


780 




TCCAGTAATG 


ACCTCAGAAC 


TCCATCTGGA 


TTTGTTCAGA 


ACGCTCGGTT 


GCCGCCGGGC 


840 


15 


GTTTTTTATT 


GGTGAGAATC 


CAAGCTAGCT 


TGGCGAGATT 


TTCAGGAGCT 


AAGGAAGCTA 


900 


AAATGGAGAA 


AAAAATCACT 


GGATATACCA 


CCGTTGATAT 


ATCCCAATGG 


CATCGTAAAG 


960 




" AACATTTTGA 


GGCATTTCAG 


TCAGTTGCTC 


AATGTACCTA 


TAACCAGACC 


GTTCAGCTGG 


1020 


20 


ATATTACGGC 


CTTTTTAAAG 


ACCGTAAAGA 


AAAATAAGCA 


CAAGTTTTAT 


CCGGCCTTTA 


1080 








t\ 1 J. OV, i. <w 


ATCCGGAATT 


TCGTATGGCA 


ATGAAAGACG 


1140 




GTGAGCTGGT 


GATATGGGAT 


AGTGTTCACC 


CTTGTTACAC 


CGTTTTCCAT 


GAGCAAACTG 


1200 


25 


AAACGTTTTC 


ATCGCTCTGG 


AGTGAATACC 


ACGACGATTT 


eCGGCAGTTT 


CTACACATAT 


1260 




ATTCGCAAGA 


TGTGGCGTGT 


TACGGTGAAA 


ACCTGGCCTA 


TTTCCCTAAA 


GGGTTTATTG 


1320 


30 


AGAATATGTT 


TTTCGTCTCA 


GCCAATCCCT 


GGGTGAGTTT 


CACCAGTTTT 


GATTTAAACG 


1380 


TGGCCAATAT 


GGACAACTTC 


TTCGCCCCCG 


TTTTCACCAT 


GGGCAAATAT 


TATACGCAAG 


1440 




GCGACAAGGT 


GCTGATGCCG 


CTGGCGATTC 


AGGTTCATCA 


TGCCGTCTGT 


GATGGCTTCC 


1500 


35 


ATGTCGGCAG 


AATGCTTAAT 


GAATTACAAC 


AGTACTGCGA 


TGAGTGGCAG 


GGCGGGGCGT 


1560 




AATTTTTTTA 


AGGCAGTTAT 


TGGTGCCCTT 


AAACGCCTGG 


GGTAATGACT 


CTCTAGCTTG 


1620 


40 


AGGCATCAAA 


TAAAACGAAA 


GGCTCAGTCG 


AAAGACTGGG 


CCTTTCGTTT 


TATCTGTTGT 


1680 


TTGTCGGTGA 


ACGCTCTCCT 


GAGTAGGACA 


AATCCGCCGC 


TCTAGAGCTG 


CCTCGCGCGT 


1740 




TTCGGTGATG 


ACGGTGAAAA 


CCTCTGACAC 


ATGCAGCTCC 


CGGAGACGGT 


CACAGCTTGT 


1800 


45 


CTGTAAGCGG 


ATGCCGGGAG 


CAGACAAGCC 


CGTCAGGGCG 


CGTCAGCGGG 


TGTTGGCGGG 


1860 




TGTCGGGGCG 


CAGCCATGAC 


CCAGTCACGT 


AGCGATAGCG 


GAGTGTATAC 


TGGCTTAACT 


1920 




' ATGCGGCATC 


AGAGCAGATT 


GTACTGAGAG 


TGCACCATAT 


GCGGTGTGAA 


AT APPf^ P A p a 


1 Q p n 


50 


GATGCGTAAG 


GAGAAAATAC 


CGCATCAGGC 


GCTCTTCCGC 


TTCCTCGCTC 


ACTGACTCGC 


2040 




TGCGCTCGGT 


CTGTCGGCTG 


CGGCGAGCGG 


TATCAGCTCA 


CTCAAAGGCG 


GTAATACGGT 


2100 
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TATCCACAGA ATCAGGGGAT AACGCAGGAA 
CCAGGAACCG TAAAAAGGCC GCGTTGCTGG 

5 

AGCATCACAA AAATCGACGC TCAAGTCAGA 
ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG 
CCGGATACCT GTCCGCCTTT CTCCCTTCGG 

10 

GTAGGTATCT CAGTTCGGTG TAGGTCGTTC 
CCGTTCAGCC CGACCGCTGC GCCTTATCCG 
,5 GACACGACTT ATCGCCACTG GCAGCAGCCA 

TAGGCGGTGC TACAGAGTTC TTGAAGTGGT 
TATTTGGTAT CTGCGCTCTG CTGAAGCCAG 
GATCCGGCAA ACAAACCACC GCTGGTAGCG 
CGCGCAGAAA AAAAGGATCT CAAGAAGATC 
AGTGGAACGA AAACTCACGT TAAGGGATTT 

25 

CCTAGATCCT TTTAAATTAA AAATGAAGTT 
CTTGGTCTGA CAGTTACCAA TGCTTAATCA 
TTCGTTCATC CATAGCTGCC TGACTCCCCG 

30 

TACCATCTGG CCCCAGTGCT GCAATGATAC 
TATCAGCAAT AAACCAGCCA GCCGGAAGGG 
35 CCGCCTCCAT CCAGTCTATT AATTGTTGCC 

ATAGTTTGCG CAACGTTGTT GCCATTGCTA 

GTATGGCTTC ATTCAGCTCC GGTTCCCAAC 

40 

TGTGCAAAAA AGCGGTTAGC TCCTTCGGTC 

CAGTGTTATC ACTCATGGTT ATGGCAGCAC 

TAAGATGCTT TTCTGTGACT GGTGAGTACT 

45 

GGCGACCGAG TTGCTCTTGC CCGGCGTCAA 
CTTTAAAAGT GCTCATCATT GGAAAACGTT 
5P CGCTGTTGAG ATCCAGTTCG ATGTAACCCA 

TTACTTTCAC CAGCGTTTCT GGGTGAGCAA 



AGAACATGTG AGCAAAAGGC CAGCAAAAGG 2160 

CGTTTTTCCA TAGGCTCCGC CCCCCTGACG 2220 

GGTGGCGAAA CCCGACAGGA CTATAAAGAT 22 80 

TGCGCTCTCC TGTTCCGACC CTGCCGCTTA 234 0 

GAAGCGTGGC GCTTTCTCAA TGCTCACGCT 2400 

GCTCCAAGCT GGGCTGTGTG CACGAACCCC 2460 

GTAACTATCG TCTTGAGTCC AACCCGGTAA 2 520 

CTGGTAACAG GATTAGCAGA GCGAGGTATG 2 580 

GGCCTAACTA CGGCTACACT AGAAGGACAG 264 0 

TTACCTTCGG AAAAAGAGTT GGTAGCTCTT 2700 

GTGGTTTTTT TGTTTGCAAG CAGCAGATTA 2760 

CTTTGATCTT TTCTACGGGG TCTGACGCTC 2 820 

TGGTCATGAG ATTATCAAAA AGGATCTTCA 2 880 

TTAAATCAAT CTAAAGTATA TATGAGTAAA 2 940 

GTGAGGCACC TATCTCAGCG ATCTGTCTAT 3 000 

TCGTGTAGAT AACTACGATA CGGGAGGGCT 3060 

CGCGAGACCC ACGCTCACCG GCTCCAGATT 3120 

CCGAGCGCAG AAGTGGTCCT GCAACTTTAT 3180 

GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA 3240 

CAGGCATCGT GGTGTCACGC TCGTCGTTTG 3 3 00 

GATCAAGGCG AGTTACATGA TCCCCCATGT 3360 

CTCCGATCGT TGTCAGAAGT AAGTTGGCCG 3420 

TGCATAATTC TCTTACTGTC ATGCCATCCG 34 80 

CAACCAAGTC ATTCTGAGAA TAGTGTATGC 3540 

TACGGGATAA TACCGCGCCA CATAGCAGAA "3600 
CTTCGGGGCG AAAACTCTCA AGGATCTTAC 3660 
CTCGTGCACC CAACTGATCT TCAGCATCTT 3720 
AAACAGGAAG GCAAAATGCC GCAAAAAAGG 3780 
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10 



15 



20 



25 



50 



GAATAAGGGC GACACC3GAAA TGTTGAATAC TCATACTCTT CCnTTTCAA TATTATTGAA 
GCATTTATCA GGGTTATTGT CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA 
AACAAATAGG GGTTCCGCGC ACATTTCCCC GAAAAGTGCC ACCTGACGTC TAAGAAACCA 
TTATTATCAT GACATTAACC TATAAAAATA GGCGTATCAC GAGGCCCTTT CGTCTTCAC 

(2) INFORMATION ZU SEQ ID NO : 40: 

(i) SEQUEN2 CHARAKTERISTIKA: 

(A) LANGE: 3 999 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) * LAGE: 1. .3999 



3840 
3900 
3960 
4019 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 40: 

CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT AATAGATTCA 60 

3^ ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG AGGAGAAATT AACTATGAGA 120 

GGATCGCATC ACCATCACCA TCACACGGAT CCGCATGCGA GCTCCCAGTG GGAGGTGAGC 180 

CAGGTGCCCC TGGACCTGTG TGAGGTCTAT GGCGGGGGCT GCCACGGTTG CCTCATGTCC 240 

CGAGACCCCT ACTGCGGCTG GGACCAGGGC CGCTGCATCT CCATCTACAG CTCCGAACGG 300 

TCAGTGCTGC AATCCATTAA TCCAGCCGAG CCACACAAGG AGTGTCCCAA CCCCAAACCA 360 

GACAAGGCCC CACTGCAGAA GGTTTCCCTG GCCCCAAACT CTCGCTACTA CCTGAGCTGC 420 

40 

'CCCATGGAAT CCCGCCACGC CACCTACTCA TGGCGCCACA AGGAGAACGT GGAGCAGAGC 4 80 

-TGCGAACCTG GTCACCAGAG CCCCAACTGC ATCCTGTTCA TCGAGAACCT CACGGCGCAG 54 0 

45 CAGTACGGCC ACTACTTCTG CGAGGCCCAG GAGGGCTCCT ACTTCCGCGA GGCTCAGCAC 600 

TGGCAGCTGC TGCCCGAGGA CGGCATCATG GCCGAGCACC TGCTGGGTCA TGCCTGTGCC 660 

CTGGCTGCCT CCCTCTGGCT GGGGGTGCTG CCCACACTCA CTCTTGGCTT GCTGGTCCAC 720 

GTGAAGCTTA ATTAGCTGAG CTTGGACTCC TGTTGATAGA TCCAGTAATG ACCTCAGAAC 7 80 

TCCATCTGGA TTTGTTCAGA ACGCTCGGTT GCCGCCGGGC GTnTTTATT GGTGAGAATC 840 
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CAAGCTAGCT TGGCGAGATT TTCAGGAGCT AAGGAAGCTA AAATGGAGAA AAAAATCACT 900 
GGATATACCA CCGTTGATAT ATCCCAATGG CATCGTAAAG AACATTTTGA GGCATTTCAG 960 

5 

TCAGTTGCTC AATGTACCTA TAACCAGACC GTTCAGCTGG ATATTACGGC CmTTAAAG 1020 

ACCGTAAAGA AAAATAAGCA CAAGTTTTAT CCGGCCTTTA TTCACATTCT TGCCCGCCTG 1080 

10 ATGAATGCTC ATCCGGAATT TCGTATGGCA ATGAAAGACG GTGAGCTGGT GATATGGGAT 114 0 

AGTGTTCACC CTTGTTACAC CGTTTTCCAT GAGCAAACTG AAACGTTTTC ATCGCTCTGG 1200 

AGTGAATACC ACGACGATTT CCGGCAGTTT CTACACATAT ATTCGCAAGA TGTGGCGTGT 1260 

15 

TACGGTGAAA ACCTGGCCTA TTTCCCTAAA GGGTTTATTG AGAATATGTT TTTCGTCTCA 1320 

GCCAATCCCT GGGTGAGTTT CACCAGTTTT GATTTAAACG TGGCCAATAT GGACAACTTC 1380 

TTCGCCCCCG TTTTCACCAT GGGCAAATAT TATACGCAAG GCGACAAGGT GCTGATGCCG 1440 

20 

CTGGCGATTC AGGTTCATCA TGCCGTCTGT GATGGCTTCC ATGTCGGCAG AATGCTTAAT 1500 

GAATTACAAC AGTACTGCGA TGAGTGGCAG GGCGGGGCGT AATTTTTTTA AGGCAGTTAT 1560 

TGGTGCCCTT AAACGCCTGG GGTAATGACT CTCTAGCTTG AGGCATCAAA TAAAACGAAA 1620 

GGCTCAGTCG AAAGACTGGG CCTTTCGTTT TATCTGTTGT TTGTCGGTGA ACGCTCTCCT 1680 

GAGTAGGACA AATCCGCCGC TCTAGAGCTG CCTCGCGCGT TTCGGTGATG ACGGTGAAAA 1740 

30 

CCTCTGACAC ATGCAGCTCC CGGAGACGGT CACAGCTTGT CTGTAAGCGG ATGCCGGGAG 1800 

CAGACAAGCC CGTCAGGGCG CGTCAGCGGG TGTTGGCGGG TGTCGGGGCG CAGCCATGAC 1860 

35 CCAGTCACGT AGCGATAGCG GAGTGTATAC TGGCTTAACT ATGCGGCATC AGAGCAGATT 1920 

GTACTGAGAG TGCACCATAT GCGGTGTGAA ATACCGCACA GATGCGTAAG GAGAAAATAC 1980 

CGCATCAGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CTGTCGGCTG 2040 

40 

CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT 2100 

AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG CCAGGAACCG TAAAAAGGCC 2160 

45 GCGTTGCTGG CGXTTTTCCA TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC 2220 

TCAAGTCAGA GGTGGCGAAA CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA 2280 

AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT 2340 

CTCCCTTCGG GAAGCGTGGC GCTTTCTCAA TGCTCACGCT GTAGGTATCT CAGTTCGGTG 2400 

TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC CCGTTCAGCC CGACCGCTGC 2460 
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25 



GCCTTATCCG GTAACTATCG TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG 2520 

GCAGCAGCCA CTGGTAACAG GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC 2580 

5 

TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGGACAG TATTTGGTAT CTGCGCTCTG 2640 

CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC 2700 

10 ' GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA CGCGCAGAAA AAAAGGATCT 2760 

CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT 2820 

TAAGGGATTT TGGTCATGAG ATTATCAAAA AGGATCTTCA CCTAGATCCT TTTAAATTAA 2880 

15 

AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA CTTGGTCTGA CAGTTACCAA 2940 

TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGCTGCC 3000 

20 TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT TACCATCTGG CCCCAGTGCT 3060 

GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT TATCAGCAAT AAACCAGCCA 3120 

GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT GCAACTTTAT CCGCCTCCAT CCAGTCTATT 3180 

AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG CAACGTTGTT 3240 

GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG GTATGGCTTC ATTCAGCTCC 3300 

GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT TGTGCAAAAA AGCGGTTAGC 3360 

TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG CAGTGTTATC ACTCATGGTT 3420 

ATGGCAGCAC TGCATAATTC TCTTACTGTC ATGCCATCCG TAAGATGCTT TTCTGTGACT 3480 

GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC GGCGACCGAG TTGCTCTTGC 3540 

CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA CTTTAAAAGT GCTCATCATT 3600 

GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC CGCTGTTGAG ATCCAGTTCG 3660 

ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT TTACTTTCAC CAGCGTTTCT 3720 

- GGGTGAGCAA AAACAGGAAG GCAAAATGCC GCAAAAAAGG GAATAAGGGC GACACGGAAA 3780 

45 TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA GCATTTATCA GGGTTATTGT 384 0 

CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA AACAAATAGG GGTTCCGCGC 3900 

ACATTTCCCC GAAAAGTGCC ACCTGACGTC TAAGAAACCA TTATTATCAT GACATTAACC 3960 

' TATAAAAATA GGCGTATCAC GAGGCCCTTT CGTCTTCAC 3 999 
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(2) ANGABEN ZU SEQ ID NO: 41: 

( i ) SEQUENZKENN2EICHEN : 

(A) LANGE: 8888 Basenpaare 
(3) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKIJLS: Genom-DNA 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE:1. .8888 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 41: 

GAGCCGCACA CGGTGCTTTT CCACGAGCCA GGCAGCTCCT CTGTGTGGGT GGGAGGACGT 60 

GGCAAGGTCT ACCTCTTTGA CTTCCCCGAG GGCAAGAACG CATCTGTGCG CACGGTGAGC 120 

CTCTCTCTTC CCCCAACACC CCCCCTACCC TCTTATCTCC CCTCTGGCCC TGCCAAGGGT 180 

CCTCAGGGAA TCCGAGGGAG CTGGCTTCTC TTCCTAAACT GCCCCCACCT CCGTATCCTA 24 0 

TAAATGGCTC CTGGGGGAGG CTCCCTAAAG GTAGTCCAGA TTGGAGTGGG GAGCTGGGGC 3 00 

GGTGTGGAGA AAAACAGGAG CTAATGGGCC TGGCCAGCTG GGCAGCGCTG CTGCGGAAAG 360 

CCCAGGCTGG AAGCTGGGCC CGAGAGCCCA TGCCTGGTCT TCTGAACCCT CTGGGCCTCA 420 

GCTCTGGATA TGAGACCCTG TTTGACCTCA GGTAGATCAC TCACCCTCTC AGAGCCCCAG 4 80 

TTGCTCATCT GTCAGATGAG AATAATGGTT GCTTCCTTTG GGGCTTATCC TGAGGCTGTG 540 

35 TGGAAAGCAT TTCAGGGGTA CCTCACCCCT GGCAGATTGA ACTAATGCTT CTCCCCTTCC 600 

CCAGGTGAAT ATCGGCTCCA CAAAGGGGTC CTGTCTGGAT AAGCGGGTGA GCGGGGGAGG 660 

GATCTGGAGG GGTCTGAGCC ACTTGGTAAA GGGAGAGGAG ACCCTGAGGG TCTAAGGAAG 720 

GAAGCATGGC CCTGCCCCAC GAGTCCCAGA CTGATGGGGA GACGTGGTCC TCTGTGCTTA 780 

GGGGATGGCG TCAGCTGCAC ACACTCTGGG CTGTCCCGGG AGGCTGTCAC CTATGCTAAG 84 0 

CCCTTCTGAC ACCTTCTTCC CTGATCCTGG GGGTCCTAGT GCTAGGCTTG CCAGGGCCTT 900 

CCAGCAACCA ATTTCTCTCC TCCCTTCTCT CTTCCCCGGG CAGGACTGCG AGAACTACAT 960 

CACTCTCCTG GAGAGGCGGA GTGAGGGGCT GCTGGCCTGT GGCACCAACG CCCGGCACCC 1020 

50 CAGCTGCTGG AACCTGGTGA GAAGGCTGCT CCCCATGTGC CTGATCAGCT CACCTTCTAC 1080 

TGCGTGGGCT TCTGCCCCTC ATGGTGGGAA GGAGATGGCG AGACTCCAAT GCTGGCCTTG 1140 
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TTGATATTGC TGGCAGTGGT TTCCTGGGGT 
GCCTCTTCTC CCCTCTACCC TTCCAGGGGG 

5 

CCAAGTGGAA CACTTTTCTG AAAGCCATGC 
ACTTCAACAG GCTGCAAGAC GTCTTCCTGC 
CCAGGGTCTA TGGTGTTTTC TCCAACCCCT 
TGGCATTGGT TCAGTGTCCA GTAGGGACAG 
GGTGTGGCAG GAGCAGGGGC TGCAGGCTCA 
GGGGGACAGC CAGTGCGATG TATGTACTGT 
TGTGCATGCC CTATATGCAC ACTCATGACT 
TTGTGCCGAG AGTGGACACT GGGCCCAGGA 

20 

GCGTGCTATT ACACCTGCTC AGGCACTGCC 
TCTCATTGAT TGAACACACG GCAGGCGGAA 
25 TAGAGTGGAG GAAGCCAAGA CCCTGCTCTG 

GGGAAGGGGT TGGGGGTCTG GCCTCCTGGG 
AGGGCTAGAG AACTGCTCAG CCTATGATGG 

30 

AGATGGCCTC TAGACTCAGT GATTCTGTAA 
GCACAAAGAA ATTAGGCTGA ACTCCTCTCC 
TGGTGGTTGG CAACTCAGTG CCAGGCACAA 

35 

TGGGTTCTGG GCCCCCCATT GAGCTGGTCT 
TGTGTGTATT CCCTCGGTGA CATTGACAAG 
40 CACTCAAGCC TTCCCAACCC GCGGCCTGGC 

GCCCAGCCCT CCTTCTGCCT CACCTCCCAC 
CCCAGTGCCT CCCAGACCAG CAGCCGATAC 
ACCCAGAGGT GGCGCAGAGG GTGGAGCCCA 
CTAAATACCA CTACCAGAAA GTGGCCGTCC 
TTCATGTGCT TTACCTAACT ACAGGTGAGA 

50 

AAAAACGGGC ATGAAAGGTG TAAGGAATAA 



GTGTGGGGAA GCCCGGGCAG GTGCTGAGGG 2880 

ACCAGGGTGG GGAAAGTTCA CTGTCAGTCT 294 0 

TGGTATGCAG TGATGCTGCC ACCAACAAGA 3000 

TCCCTGACCC CAGCGGCCAG TGGAGGGACA 3060 

GGTGAGTGGC CCTTGTCCTG GGGCCGGGGC 3120 

GAGGCCTTGG GCCCTGCTGA GGGCCTCCCT 3180 

AGAGGCTGGG CTGTTGCTGG GTGTGGGGTG 324 0 

TGTGTGAGTG AGTCTGCACT CATGGGTGTG 3300 

GCACTTGTGC CTGTGTGTCC CACCACCTGC 3360 

GGAAGCTGCT GAAGCATCTC TCGGGGAGCT 3420 

TOAQCCCGAT AATTCACA.CT TCTTAATGAC 3480 

GTGTTGGGTG TGTGTGGGGA GAGTTAGGGA 3 540 

TGGCTCCTGG GTGAGTGGGT CCCCCAGGCT 3600 

GCATCAGCAC CCCACAGCCT GTGCCCAGGG 3660 

GGTTCCTCCT GCCTTGGGGT TGGGTAGAGC 3720 

CAGGATACAA GTTTGTGGrT TTAAATTGCA 3 780 

TTCCTCCTCT CCATCCCTCC CCATTTTCAG 3840 

GGCTGGCCTG GGTGAGTGGA GGTGGATGGG 3 900 

CCATGTCACT GCAGGAACTA CTCAGCCGTC 3 960 

GTCTTCCGTA CCTCCTCACT CAAGGGCTAC 4 020 

AAGGTGAGCG TGACACCAGC CGTGGCCCAG 4080 

CACCCCACTG ACCTGGGCCT GCTCTCCTTG 4140 

CCACAGAGAC CTTCCAGGTG GCTGACCGTC 4200 

TGGGGCCTCT GAAGACGCCA TTGTTCCACT 4260 

ACCGCATGCA AGCCAGCCAC GGGGAGACCT 432 0 

GGCTACCCCG GGACCCTCAG TTTGCTTTGT 4 3 80 

TGTAGTTAAC ATCTGGTTGG ATCTTTACAT 4440 
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4500 
4560 
4620 
4660 
4740 
4800 
4860 
4920 



GTGGAAGGAA TAATTGAGTG ACTGGAGTTG TCAGGGGTTA ATGTGTGTGG GTCTGGAAGA 
GCCAGGCAGG GAGAGCTTCC TGGAGGAGGT AGGGGCAAGA GGGAAAGGGG GATGGGAGAA 
AAGCAAGCAC TGGGATTTGG AGGCGGAAAT CTGGAGAGTC TGAGCAAAGC CAGGTGCACC 
TTTGGTCCAG ATGTCTGACT CAGGGAAGAA GATGGTAGGA AGAGACGTCG CAAATCAGGA 
GGAGGGGCCT GAACCACAGG GATACTGGCC TCTGCCAGGC AGAATGAGGG AGTX:AGGCCC 
TGCGCCTGTC TTTGGGATTG TGCAGGTGAG AAGAAACATT TGAGGAGTTG ATGGGGCACA 
AATTAGGTAT GGGGAAGGAG TTCCAGGGGG CAGAACCTTT GCCATCTCAC AGAGGACAGG 
GGCAGCTTCT CTTCTTCCCT GGAGTAGGCC CTGCTGGGGG AAGCTGGGTG GAATCCCGTG 

GGAGATCCTC CTGCTTTCTG GAAAGCCACA GGACACGGAG GAGCCAGTCC TGAGTTCGGT 4 980 

TTGTCGCAGC TTCCCATGCC AGCTGCCTTC CTTGAGACTC GAAAGGGCCT CTAGCACCCC 504 0 

TGGGGCCATT CAATTCAGGC CCAGGCGCCC AACCTCAGTT GrrCACATTC CCCATGTGAT Sloo 

CTCCTGTTGC TGCTTCACCT TCGGACrGTC TCGGCTTTGG TGACCTTCTA GGAAACTGGA 5160 

ACCCCAGCAC CATTGTTTGG CTCCTGGAAG CCTTGGGGAG AGGAATTTCC CACAGGGCAG 5220 

GGCCTGGGTC CTGATTCCCT GCCTCTTTAC TCCCTATTCA TCCCGGCTAC ACCCTTGGGC 5280 

CCCCATCCTT GCTTGGCTCC AGTACTGGCT GGCACAGCTG TTGTGGTCAT CCAGGGATGG 5340 

CAGGGCACTG GGGAACAGAA GAGAGAGGTC ACACAGTGCG GAACTCGGAG CAGGAGCTAG 54 00 

GACAAGGAAG GCTGGACTTG GGCCATGGAT TCCCTTCCTG CAGACTTCGG AAGTGAGCAC 5460 

ACTTGAGTGA TTAGAGAAGG TGTCTTCGTT CTAAGGGCAG TGGAGGAGGC ACCATTTTGG 5520 

AGCCTGCATC ATTCGTATTT GGGCTAGATT GAAAAATAGA GCTTTCTAAG TCCTCTGCAG 5580 

AGAATGGGAG GCTCTCACAA CTGGGAGAAG TATTGGCTCT TTTCCTGAGA ATTTTGCCAA 5640 

GGGTATGCTG TTACTGGGGC TGGTTTGGAA GGAGTATAGG GCATTATGTC TGTCAAGGCA 5700 

GTGGCTGGGG TGGGGCCTTA TCAGGCCCAA GGAGCATCTG GCCACATCTC AGAGTCCACA 5760 

. GATGAGGATC ACGGATGTOT AGAGGAAACA TCCTAGGCAG GCAATCATCT GACTGCTTTT 5820 

« TTGGGGCAGG TGATGCCCTG GGAAATTGGG AGGGAGGGAG AGAGGGAGGT AGGCTATTCT 5880 

AGAAACTGGG AGAGCAGGTG AGGTAGGATT GGGAGGACCA GGGGTCAGGG TCCCCATTGG 5940 

TCCCTAATTG AGAACGGAGA GAGCATTGGT CTAGGAGGCA GGCAGCTCGG TTATAAGACC 6000 

, TTGGGAACTC TTGATTTAGA ATCCAAGATC CTTTTTAGAT CTAGGATTTT ATAAAATTAA 6060 

GATATCCCCT AAGATCAAAT GCAACGTGGA GTCCTGAATT GGATCCTAGA ACAGAAGAAG 6120 
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.rTTGTG GAAAAACTAG TGAAATCCAA 
ACCAATGTC AGTTGCCTAG TTGTGACAAA 
AGGGGGAACT GGAGAAGGGT AGATTGGAGC 
AATCTAAAAT TACTCCAAAA TAAAAAAAAA 
J GTCCAGGAGG CAGGGGAGTT GTAGAAGCAG 

CCAACTCGGT CTCTGCTGCT CACCAGCTGT 
GAGCCTGATT TCCTTATCTG TGGAGTGGGG 
GGGTTAAACG AGGTGATGCA TGGACAGCAG 
GCTTCTGTTC TTCCCGTGCA GCCTTGGGAA 
CCTCCTGGGA TGGCCTCTCT GGATCAGCCT 

20 

ACATTCTTCC CCAGTCACGC TCTGCTCGCC 
GAGTTGTGAC TTCCCACCCC TCCCCGGCCT 
25 CTCCCGCCCA CTGACCCTCT GTCCACCATA 

GGAACCGGGO GAGCAGGAGC ACAGCTTCGC 
CCGCGCGGCT GCCATCCAGA CCATGTCGCT 

30 

GCGTCCCATG GGCTATGCAG TGACTGCAGC 
TGTGTTCTTT TAAGAGCTTC TAGGCCTTAG 
GGGGCCCGGG CCTGACCCAA TCCTGCTGTC 

35 

GTGGGAGGTG AGCCAGGTGC CCCTGGACCT 
TTGCCTCATG TCCCGAGACC CCTACTGCGG 
40 CAGCTCCGAA CGGTACGTTG GCCGGGATCC 

CAGGGGGAGG TGTTGTCGGG CTGGAAGAGG 
CCTCTCTACT GGAACTGCAC TAGGGGTAAG 

45 

CTGCTGATCC TCTTTCGTCC TTCCCACTCC 
GAGCCACACA AGGAGTGTCC CAACCCCAAA 
TGTGGCCCAA TGAGTGGGGT ACTGCCCTGC 
CCTTGTCCTG TGGGCCCCAG GTACATGGGG 



ATAAAGTCTG TAGTTTTGTT AATAGTAATG 6180 

TATACCGTGG TTATGTAAGA TGGTAACATT 624 0 

TCTCTGTACT ATCTTTGCAA CTTTTCTGGG 6300 

ATGTAITTAA AGTAAATATA TTCCCTAAGA 6360 

CTGAGTGGTT GGGTTCTGAC AGATTTGGTT 6420 

GTGACCTTGA GCAAGTGGCT TAGCCTTTCT 64 80 

AAGATGACAG CCACCTCGCA GGGCTGTGGA 6540 

CCGCACTGAC CTTGCTGGTG TGGGGCTCCT 6600 

TGTTGGAGGC CGTATCCAGG GACCCCTGGG 6660 

TGGAAGGTTC CAGGCTGCCC TTAGGCTCCC 6720 

CTGCCCACAC CAGTCCTGTG ACCCTTGeCT 6730 

AGAGGAAAGC TGCCTGGCCC CTCAGTGGGA 6840 

CACAGACAGG GGCACTATCC ACAAGGTGGT 6900 

CTTCAACATC ATGGAGATCC AGCCCTTCCX3 6960 

GGATGCTGAG CGGGTGAGCC TTCCCCCACT 7020 

TGAGGACAGG GCTCCTTTGC ATGTGATTTG 7080 

GGCCTGGACA TTTAGGACTG AGTGTGGGGT 714 0 

CTTCCAGAGG AAGCTGTATG TGAGCTCCCA 7200 

GTGTGAGGTC TATGGCGGGG GCTGCCACGG 7260 

CTGGGACCAG GGCCGCTGCA TCTCCATCTA 7320 

CTCCGTCCCT GGGACAAGGT GGGCATGGGA 7380 

TGGCGGTACT GGGCCTTTCT TGTGGGACCT 7440 

GATATGAGGG TCAGGTCTGC AGCCTTGTAT 7500 
AGGTCAGTGC TGCAATCCAT TAATCCAGCC - 7560 

CCAGGTACCT GATCTGGCCC TGCTGGCGGC 7620 

CCTGATTGTC CTGGTCTGAG GGAAACATGG 7680 

CAGGATACAG TCCTGCAGAG GGAGCCCTCT 7740 
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TGGTGGGATG 


AGCGAGACGG 


GAGAAAAAAG 


GAGGACGCTG 


AGGGCTGGGT 


TCCCCACGTT 


7800 


CATTCAGAAG 


CCTTGTCCTG 


GGATCCCAGT 


CGGTGGGGAG 


GACACATCCT 


CCCCTGGGAG 


7860 


CTCTTTGTCC 


CTCCTCACGG 


CTGCTTCCCC 


ACTGCCTCCC 


CAGACAAGGC 


CCCACTGCAG 


7920 


AAGGTTTCCC 


TGGCCCCAAA 


CTCTCGCTAC 


TACCTGAGCT 


GCCCCATGGA ATCCCGCCAC 


7980 


GCCACCTACT 


CATGGCGCCA 


CAAGGAGAAC 


GTGGAGCAGA 


GCTGCGAACC 


TGGTCACCAG 


8040 


AGCCCCAACT 


GCATCCTGTT 


CATCGAGAAC 


CTCACGGCGC 


AGCAGTACGG 


CCACTACTTC 


8100 


TGCGAGGCCC 


AGGAGGGCTC 


CTACTTCCGC 


GAGGCTCAGC 


ACTGGCAGCT 


GCTGCCCGAG 


8160 


GACGGCATCA 


TGGCCGAGCA 


CCTGCTGGGT 


CATGCCTGTG 


CCCTGGCCGC 


CTCCCTCTGG 


8220 


CTGGGGGTGC 


TGCCCACACT 


CACTCTTGGC 


TTGCTGGTCC 


ACTAGGGCCT 


CCCGAGGCTG 


8280 


GGCATGCCTC 


AGGCTTCTGC 


AGCCCAGGGC 


ACTAGAACGT 


CTCACACTCA 


GAGCCGGCTG 


8340 


GCCCGGGAGC 


TCCTTGCCTG 


CCACTTCTTC 


CAGGGGACAG 


AATAACCCAG 


TGGAGGATGC 


8400 


CAGGCCTGGA 


GACGTCCAGC 


CGCAGGCGGC 


TGCTGGGCCC 


CAGGTGGCGC 


ACGGATGGTG 


8460 


AGGGGCTGAG 


AATGAGGGCA 


CCGACTGTGA 


AGCTGGGGCA 


TCGATGACCC 


AAGACTTTAT 


8520 


CTTCTGGAAA 


ATATTTTTCA 


GACTCCTCAA 


ACTTGACTAA 


ATGCAGCGAT 


GCTCCCAGCC 


8580 


CAAGAGCCCA 


TGGGTCGGGG 


AGTGGGTTTG 


GATAGGAGAG 


CTGGGACTCC 


ATCTCGACCC 


8640 


TGGGGCTGAG 


GCCTGAGTCC 


TTCTGGACTC 


TTGGTACCCA 


CATTGCCTCC 


TTCCCCTCCC 


8700 


TCTCTCATGG 


CTGGGTGGCT 


GGTGTTCCTG 


AAGACCCAGG 


GCTACCCTCT 


GTCCAGCCCT 


8760 


GTCCTCTGCA 


GCTCCCTCTC 


TGGTCCTGGG 


TCCCACAGGA 


CAGCCGCCTT 


GCATGTTTAT 




TGAAGGATGT 


TTGCTTTCCG 


GACGGAAGGA 


CGGAAAAAGC 


TCTGAAAAAA 


AAAAAAAAAA 


8880 


AAAAAAAA 












8888 



~ (2) ANGABEN ZU SEQ ID NO: 42: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 6622 Basenpaare 

(B) ART: Nucleotid 

45 (C:) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Genom-DNA 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE:1. .6622 
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CCCGAGACCC CTACTGCC3GC TCGGACCAGG GCCGCTGCAT CTCCATCTAC AGCTCCGAAC 1620 

GGTCAGTGCT GCAATCCATT AATCCAGCCG AGCCACACAA GGAGTGTCCC AACCCCAAAC 1680 

CAGACAAGGC CCCACTGCAG AAGGTTTCCC TGGCCCCAAA CTCTCGCTAC TACCTGAGCT 1740 

GCCCCATGGA ATCCCGCCAC GCCACCTACT CATGGCGCCA CAAGGAGAAC GTGGAGCAGA 1800 

' GCTGCGAACC TGGTCACCAG AGCCCCAACT GCATCCTGTT CATCGAGAAC CTCACGGCGC I860 

AGCAGTACGG CCACTACTTC TGCGAGGCCC AGGAGGGCTC CTACTTCCGC GAGGCTCAGC 1920 

- ACTGGCAGCT GCTGCCCGAG GACGGCATCA TGGCCGAGCA CCTGCTGGGT CATGCCTGTG 1980 
CCCTGGCTGC CTGAATTCGA AGCTTGGAGT CGACTCTGCT GAAGAGGAGG AAATTCTCCT 2040 

: TGAAGTTTCC CTGGTGTTCA AAGTAAAGGA GTTTGCACCA GACGCACCTC TGTTCACTGG 2100 

; TCCGGCGTAT TAAAACACGA TACATTGTTA TTAGTACATT TATTAAGCGC TAGATTCTGT 2160 

- GCGTTGTTGA TTTACAGACA ATTGTTGTAC GTATTTTAAT AATTCAXTAA ATTTATAATC 222G 
TTTAGGGTGG TATGTTAGAG CGAAAATCAA ATGATTTTCA GCGTCTTTAT ATCTGAATTT 2280 

^5 AAATATTAAA TCCTCAATAG ATTTGTAAAA TAGGTTTCGA TTAGTTTCAA ACAAGGGTTG 2 34 0 

TTTTTCCGAA CCGATGGCTG GACTATCTAA TGGATTTTCG CTCAACGCCA CAAAACTTGC 2400 

CAAATCTTGT AGCAGCAATC TAGCTTTGTC GATATTCGTT TGTGTTTTGT TTTGTAATAA 2460 

30 

AGGTTCGACG TCGTTCAAAA TATTATGCGC TTTTGTATTT CTTTCATCAC TGTCGTTAGT 2520 

GTACAATTGA CTCGACGTAA ACACGTTAAA TAAAGCCTGG ACATATTTAA CATCGGGCGT 2580 

35 GTTAGCTTTA TTAGGCCGAT TATCGTCGTC GTCCCAACCC TCGTCGTTAG AAGTTGCTTC 264 0 

CGAAGACGAT TTTGCCATAG CCACACGACG CCTATTAATT GTGTCGGCTA ACACGTCCGC 2700 

GATCAAATTT GTAGTTGAGC TTTTTGGAAT TATTTCTGAT TGCGGGCGTT TTTGGGCGGG 2 760 

TTTCAATCTA ACTGTGCCCG ATTTTAATTC AGACAACACG TTAGAAAGCG ATGGTGCAGG 2 820 

CGGTGGTAAC ATTTCAGACG GCAAATCTAC TAATGGCGGC GGTGGTGGAG CTGATGATAA 2880 

ATCTACCATC GGTGGAGGCG CAGGCGGGGC TGGCGGCGGA GGCGGAGGCG GAGGTGGTGG 2 940 

CGGTGATGCA GACGGCGGTT TAGGCTCAAA TTGTCTCTTT CAGGCAACAC AGTCGGCACC 3000 

*■ TCAACTATTG TACTGGTTTC GGGCGTATGG TGCACTCTCA GTACAATCTG CTCTGATGCC 3060 

GCATAGTTAA GCCAGCCCCG ACACCCGCCA ACACCCGCTG ACGCGCCCTG ACGGGCTTGT 3120 

CTGCTCCCGG CATCCGCTTA CAGACAAGCT GTGACCGTCT CCGGGAGCTG CATGTGTCAG 3180 
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AGGTTTTCAC CGTCATCACC GAAACGCGCG 
TTATAGGTTA ATGTCATGAT AATAATGGTT 

5 

AATGTGCGCG GAACCCCTAT TTGTTTATTT 
ATGAGACAAT AACCCTGATA AATGCTTCAA 
CAACATTTCC GTGTCGCCCT TATTCCCTTT 

10 

CACCCAGAAA CGCTGGTGAA AGTAAAAGAT 
TACATCGAAC TGGATCTCAA CAGCGGTAAG 
15 TTTCCAATGA TGAGCACTTT TAAAGTTCTG 

GCCGGGCAAG AGCAACTCGG TCGCCGCATA 
TCACCAGTCA CAGAAAAGCA TCTTACGGAT 
GCCATAACCA TGAGTGATAA CACTGCGGCC 
AAGGAGCTAA CCGCTTTTTT GCACAACATG 
GAACCGGAGC TGAATGAAGC CATACCAAAC 

25 

ATGGCAACAA CGTTGCGCAA ACTATTAACT 
CAATTAATAG ACTGGATGGA GGCGGATAAA 
30 CCGGCTGGCT GGTTTATTGC TGATAAATCT 

ATTGCAGCAC TGGGGCCAGA TGGTAAGCCC 
AGTCAGGCAA CTATGGATGA ACGAAATAGA 
AAGCATTGGT AACTGTCAGA CCAAGTTTAC 
CATTTTTAAT TTAAAAGGAT CTAGGTGAAG 
CCTTAACGTG AGTTTTCGTT CCACTGAGCG 

40 

TCTTGAGATC CTTTTTTTCT GCGCGTAATC 
CCAGCGGTGG TTTGTTTGCC GGATCAAGAG 
TTCAGCAGAG CGCAGATACC AAATACTGTT 
TTCAAGAACT CTGTAGCACC GCCTACATAC 
GCTGCCAGTG GCGATAAGTC GTGTCTTACC 
AAGGCGCAGC GGTCGGGCTG AACGGGGGGT 
ACCTACACCG AACTGAGATA CCTACAGCGT 



AGACGAAAGG GCCTCGTGAT ACGCCTATTT 3240 

TCTTAGACGT CAGGTGGCAC TTTTCGGGGA 3 300 

TTCTAAATAC ATTCAAATAT GTATCCGCTC 3 360 

TAATATTGAA AAAGGAAGAG TATGAGTATT 3420 

TTTGCGGCAT TTTGCCTTCC TGTTTTTGCT 34 80 

GCTGAAGATC AGTTGGGTGC ACGAGTGGGT 3540 

ATCCTTGAGA GTTTTCGCCC CGAAGAACGT 3600 

CTATGTGGCG CGGTATTATC CCGTATTGAC 3660 

CACTATTCTC AGAATGACTT GGTTGAGTAC 3720 

GGCATGACAG TAAGAGAATT ATGCAGTGCT 3780 

AACTTACTTC TGACAACGAT CGGAGGACCG 3840 

GGGGATCATG TAACTCGCCT TGATCGTTGG 3900 

GACGAGCGTG ACACCACGAT GCCTGTAGCA 3960 

GGCGAACTAC TTACTCTAGC TTCCCGGCAA 4020 

GTTGCAGGAC CACTTCTGCG CTCGGCCCTT 4080 

GGAGCCGGTG AGCGTGGGTC TCGCGGTATC 4140 

TCCCGTATCG TAGTTATCTA CACGACGGGG 4200 

CAGATCGCTG AGATAGGTGC CTCACTGATT 4260 

TCATATATAC TTTAGATTGA TTTAAAACTT 4 320 

ATCCTTTTTG ATAATCTCAT GACCAAAATC 4380 

TCAGACCCCG TAGAAAAGAT CAAAGGATCT 4440 

TGCTGCTTGC AAACAAAAAA ACCACCGCTA 4500 

CTACCAACTC TTTTTCCGAA GGTAACTGGC 4 560 

CTTCTAGTGT AGCCGTAGTT AGGCCACCAC 4620 

CTCGCTCTGC TAATCCTGTT ACCAGTGGCT 4680 

GGGTTGGACT CAAGACGATA GTTACCGGAT 4740 

TCGTGCACAC AGCCCAGCTT GGAGCGAACG 4 800 

GAGCTATGAG AAAGCGCCAC GCTTCCCGAA 4 860 
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GGGAGAAAGG CGGACAGGTA TCCGGTAAGC 
GAGCTTCCAG GGGGAAACGC CTGGTATCTT 

5 

CTTGAGCGTC GATTTTTGTG ATGCTCGTCA 
AACGCGGCCT TTTTACGGTT CCTGGCCTTT 
10 GCGTTATCCC CTGATTCTGT GGATAACCGT 

CGCCGCAGCC GAACGACCGA GCGCAGCGAG 
GTCTGCTCAT CCATGACCTG ACCATGCAGA 

15 

ATCAGCAACG GCTTGCCGTT CAGCAGCAGC 
CCGACATCGC AGGCTTCTGC TTCAATCAGC 
GCACGATAGA GATTCGGGAT TTCGGCGCTC 

20 

AGTGTGACGC GATGGGTATA ACCACCAGGC 
GTGCCGCTGG CGACCTGCGT TTGACCCTGC 
CGCAACTCGC CGCACATCTG AACTTCAGCC 
AAGCGAGTGG CAACATGGAA ATCGCTGATT 
TCACGGAAAA TGCCGCTCAT CCGCCACATA 

30 

CAACGCAGCA CCATCACCGC GAGGCGGTTT 
AATTCAGACG GCAAACGACT GTCCTGGCCG 
35 TGAAACGCCG AGTTAACGCC ATCAAAAATA 

TCATCAACAT TAAATGTGAG CGAGTAACAA 
GGATTGACCG TAATGGGATA GGTCACGTTG 

40 

.. TGCCAGTTTG AGGGGACGAC GACAGTATCG 

- TCCGGCACCG CTTCTGGTGC CGGAAACCAG 
AACTGTTGGG AAGGGCGATC GGTGCGGGCC 

45 

GGATGTGCTG CAAGGCGATT AAGTTGGGTA 

- AAAACGACGG GATCTATCAT TTTTAGCAGT 
50 CTAATTTTAC GACGACGATG CGAGCTTTTA 

CAAGCGTTAT CAATTTTTCA TTATCGTATT 



GGCAGGGTCG GAACAGGAGA GCGCACGAGG 4 92 0 

TATAGTCCTG TCGGGTTTCG CCACCTCTGA 4 980 

GGGGGGCGGA GCCTATGGAA AAACGCCAGC 504 0 

TGCTGGCCTT TTGCTCACAT GTTCTTTCCT 5100 

ATTACCGCCT TTGAGTGAGC TGATACCGCT 5160 

TCAGTGAGCG AGGAAGCATC CTGCACCATC 5220 

GGATGATGCT CGTGACGGTT AACGCCTCGA 52 80 

AGACCATTTT CAATCCGCAC CTCGCGGAAA 534 0 

GTGCCGTCGG CGGTGTGCAG TTCAACCACC 5400 

CACAGTTTCG GGTTTTCGAC GTTCAGACGT 5460 

TCATCGATAA TTTCACCGCC GAAAGGCGCG 5520 

CATAAAGAAA CTGTTACCCG TAGGTAGTCA 5580 

TCCAGTACAG CGCGGCTGAA ATCATCATTA 5640 

TGTGTAGTCG GTTTATGCAG CAACGAGACG 5700 

TCCTGATCTT CCAGATAACT GCCGTCACTC 5760 

TCTCCGGCGC GTAAAAATGC GCTCAGGTCA 5820 

TAACCGACCC AGCGCCCGTT GCACCACAGA 5880 

ATTCGCGTCT GGCCTTCCTG TAGCCAGCTT 594 0 

CCCGTCGGAT TCTCCGTGGG AACAAACGGC 6000 

GTGTAGATGG GCGCATCGTA ACCGTGCATC 6060 

GCCTCAGGAA GATCGCACTC CAGCCAGCTT 6120 

GCAAAGCGCC ATTCGCCATT CAGGCTGCGC 6180 

TCTTCGCTAT TACGCCAGCT GGCGAAAGGG 624 0 

ACGCCAGGGT TTTCCCAGTC ACGACGTTGT 6300 

GATTCTAATT GCAGCTGCTC TTTGATACAA 6360 

TTCAACCGAG CGTGCATGTT TGCAATCGTG 6420 

GTTGCACATC AACAGGCTGG ACACCACGTT 6480 
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GAACTCGCCG CAGTTTTGCG GCAAGTTGGA CCCGCCGCGC ATCCAATGCA AACTTTCCGA 654 0 
CATTCTGTTG CCTACGAACG ATTGATTCTT TGTCCATTGA TCGAAGCGAG TGCCTTCGAC 6600 
TTTTTCGTGT CCAGTGTGGC TT 662 2 



(2) ANGABEN ZU SEQ ID NO: 43: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 31 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Genom-DNA 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGErl. .31 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 43: 
CCGGATCCGC CCAGGGCCAC CTAAGGAGCG G 



(2) ANGABEN ZU SEQ ID NO: 44: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 29 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Genom-DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 44: 
CTGAATTCAG GAGCCAGGGC ACAGGCATG 



Patentanspruche 

1. Semaphorin enthaltend eine charakteristische Sema-Domane, dadurch gekennzeichnet, daB das Protein ein N- 
terminales Signalpeptid und im C-terminalen Bereich eine immunglobulin-ahnliche DomSne und eine Transmem- 
brandomane aufweist. wobei das Semaphorin als Semaphorin vom Typ L (SemaL) bezeichnet wird und Derivate 
des Semaphains vom Typ L 

2. Semaphorin nach Anspruch 1 . wobei das Protein (humanes Semaphorin vom Typ L (H-SemaL)) die Aminos^ure- 
sequenz SEQ ID NO. 3 hat. 
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3. Semaphorin nach einem oder mehreren der Anspruche 1 und 2. wobei das Protein im Bereich der Sema-Domane 
eine Aminosaureidentitat von mindestens 40 % im Bezug aul die Sema-Domane von H-SemaL aufweist. 

4. Semaphorin nach einem oder mehreren der Anspruche 1 bis 2, wobei das Protein die partielle Aminosaurese- 
quenz SEQ ID NO. 4 enthSIt (murines Semaphorin (M-SemaL)). 

5. Nukleinsaure enthaltend eine Nukleinsaure-Sequenz. die fur ein Semaphorin vom Typ L gemaB einem oder meh- 
reren der Anspruche 1 bis 4 kodiert sowie Derivate derselben. 

6. Nukleinsaure nach Anspruch 5. wobei besagte Nukleinsaure-Sequenz ein Semaphorin L Gen ist. 

7. Nukleinsaure nach einem oder mehreren der Anspruche 5 und S, wobei besagte Nukleinsaure-Sequenz das Gen 
von H-SemaL enthait 

8. Nukleinsaure nach Anspruch 5, wobei besagte NukieinsSure-Sequenz die cDNA eines Semaphorins vom Typ L 
enthalt. 

9. Nukleinsaure nach Anspruch 8. wobei die cDNA die cDNA von H-SemaL ist 

10. Nukleinsaure nach Anspruch 8. wobei die cDNA die cDNA von M-SemaL ist. 

11. Verfahren zur Herstellung eines Semaphorins vom Typ L gemafB einem oder mehreren der Anspruche 1 bis 4. 
dadurch gekennzeichnet, da3 eine Nukleinsaure-Sequenz. die fur ein Semaphorin vom Typ L oder ein Derivat der- 
selben kodiert. in einen Expressionsvektor Woniert und exprimiert wird. 

12. Verfahren gemaB Anspruch 1 1 , wobei fur die Expression eine eukaryotische Zelle venwendet wird, 

13. Verwendung eines Semaphorins vom Typ L oder eines Derivats desselben oder einer Nukleinsaure-Sequenz, die 
fur ein Semaphorin vom Typ L kodiert oder eines Derivats derselben zur Herstellung eines Arzneimittels, das zur 
Behandlung oder Prevention von immunologrschen Erkrankungen venwendet werden kann. 

14. Venwendung einer Nukleinsaure-Sequenz oder eines Derivats derselben nach Anspruch 13 in der Gentherapie. 

15. Venrt/endung eines Semaphorins vom Typ L oder einer Nukleinsaure-Sequenz, die fur ein Semaphorin vom Typ L 
kodiert in einem Verfahren zur Identifizierung von immunmodulierenden Wirkstoffen. 

16. Verfahren zur Identifizierung von immunmodulierenden Wirkstoffen. dadurch gekennzeichnet, da8 ein Semaphorin 
vom Typ L unter def inierten Bedingungen mit einem zu untersuchenden Wirkstoff inkubiert wird, parallel ein zweiter 
Ansatz ohne den zu untersuchenden Wirkstoff, aber unter ansonsten gleichen Bedingungen durchgef uhrt wird und 
dann die inhibierende bzw. aktivierende Wirkung des zu untersuchenden Wirkstoffs bestimmt wird. 

17. Verfahren zur Identifizierung von immunmodulierenden Wirkstoffen, dadurch gekennzeichnet daB eine Nuklein- 
saure-Sequenz, die fur ein Semaphorin vom Typ L kodiert unter definierten Bedingungen und in Gegenwart eines 
zu untersuchenden Wirkstoffs exprimiert wird und das AusmaB der Expression bestimmt wird. 

18. Verfahren zur Herstellung einer NuWeinsSure. die fur ein Semaphorin vom Typ L kodiert, wobei diese Nukleinsaure 
mit Hilfe der Polymerase Ketten Reaktion unter Venwendung von spezif ischen Primern amplifiziert wird. 

19. Semaphorin Antikbrper, dadurch gekennzeichnet daS er entweder das Epitop von H-SemaL, das den Aminosau- 
ren 1 79-378 in SED ID NO: 4 entspricht, erkennt oder daB er das Epitop von H-SemaL, das den Aminosauren 480- 
666 in SED ID NO: 4 entspricht. erkennt. 

20. Verfahren zur Herstellung eines Semaphorin Antikorpers nach Anspruch 19, wobei die Epitope als Fusionsproteine 
mit einem Epitop-Tag exprimiert und uber dieses Epitop-Tag aufgereinigt werden und die aufgereinigten Fusions- 
proteine zur Immunisierung verwendet werden. 



EP 0 892 047 A2 



1 2 3 4 5 6 7 8 

kb - 



9.5 - 

7.5 - ■ " 




EP 0 892 047 A2 




CO 

E 



o 

OL 



o 



EP 0 892 047 A2 



CO 

o 

<: 



CO 



CO 



CO 
I 

UJ 



o 

CVJ< 



CO 

<: 



CO 



> 
< 

<Cljj 
<co2 



o 



LU 

CO 



CD 



1^ 



CO 



CO 



CO 
<>5 



J5 



CO 

a. 
< 

<co^ 
— ocoujLy 



.00 



_j^Lu <:< Q_ <<< 




EP 0 892 047 A2 



E 
I— 

CD 



CO 

E E 

^ E 
^t= CO 

CL<: 
CO 



\ 



- O 



CO 

• o 



CVJ 

O 



E 
E 

Cl. 




o 
o 



o 

CO 



o 

CO 



CD 



o 



o 
•o 
cvj 



I 

o 

CO 



t 

o 

CO 



I ' ' ' ' M ' ' M ' ' ' M I I I I I I I I I [ O 

o o o o o o 
o o o o o 

O CO CO CVJ 

— SMOH-OSS/H-OSS 



EP 0 892 047 A2 



CO 

±= CO 

rsl 

CD CZ 
C/D 



CO 

t o 



CV4 
r O 



CD 
CO 



'2 



r 



8SS|U6!8J3 




8MQH-0SS/H-0SS 



EP 0 892 047 A2 



E 
E 

CO 

o 



o 

CO 
CO 

CO 




8SSiu6|8J3 




o 



o 
o 

CO 



o 

CO 



o 
•o 



o 

CSJ 



I > M I I r 
O O 

o o 

O CO 



I I I I I 

o 
o 

CO 



CD 
I 

o 

CO 



I 

o 

CO 



I I I I I I I I I I I o 

o o o 
o o 

^ CM 



9y(?H-0SS/H-0SS 



EP 0 892 047 A2 




O 



CO 

O 



O 



CO 



E 

i 

qI 



-« — r 



3SS!U6!9JB 



1 M I I I I I I I I I 

o o o 
o o o 

O CO CO 




8MOH-0SS/H-0SS 



EP 0 892 047 A2 



E 
E 

CO 



CO 



O 
CO 

o 

CO 




o 
o 



9SS!u6!8J3 




I » » 1 1 1 1 

o o 
o o 
o oo 



TT 



o 
o 

CO 



o 
o 



TV 



o 
o 

CsJ 



ai|OH-0SS/H-0SS 



EP 0 892 047 A2 




8SS!u6!9jg 




:0 
I 

o 

CO 



I 

o 

CO 



'I I I I I I T I I I I t I I I I I 

o o o o 
o o o o 

O CX5 CO 



rrr- 

o 
o 

CVJ 



9MQH-0SS/H-0SS 



EP 0 892 047 A2 




EP 0 892 047 A2 



CO 

^ CO 

rsj 

CD c: 

Q.< 

CO 



\ 



o 



CO 

O 



O 



CD 
CO 



E 
E 



O 




o o 

-O CO 
. CJ Ll. 



I I 1 I I I I 1 I I I I I I I I I I I I I I I I I 

o o o o o o 

O O C3 o o 
O OO CO ^ C\J 



8MQH-3SS/H-0SS 



EP 0 892 047 A2 




EP 0 892 047 A2 



I 



r • 



E 
E 

CO 




o 

CO 



8SS!u6!9J3 



o 

CO 
CO 



o 




o 
o 
o 



o 
o 

CO 



I I I I I I I I I 
o o 
o o 

CO ^ 



o 
o 

CVJ 



-n- 



9MQH-0SS/H-0SS 



EP 0 892 047 A2 




EP 0 892 047 A2 




EP 0 892 047 A2 



IB 



1 2 3 4 5 6 7 8 M 9 10 



97k 

66k 
46k 



H-SemaL- 



EP 0 892 047 A2 



1 2 3 4 5 6 



EP 0 892 047 A2 




u- O 



o 
Co 



(19) 



J 




(12) 



Europaisches Patentamt 
European Patent Office 
Off ice europeen des brevets (11) EP 0 892 047 A3 

EUROPAISCHE PATENTANMELDUNG 



(88) Verofferrtlichungstag A3: 

08.03.2000 Patentblatt 2000/10 

(43) Verofferrtlichungstag A2: 

20.01.1999 Patentblatt 1999/03 

(21) Anmeldenummer: 98112470.4 

(22) Anmeldetag: 06.07.1998 



(51) lntci7: C12N 15/12. C07K 14/47, 
A61K 48/00, G01N 33/50 



(84) Benannte Vertragsstaaten: 


(71) Anmelder: 


AT BE CH CY DE DK ES R FR GB GR IE IT LI LU 


Hoechst Marion Roussel Deutschland GmbH 


MC NL PT SE 


65929 Frankfurt am Main (DE) 


Benannte Erstreckungsstaaten: 


AL LT LV MK RO SI 


(72) Erfinder: 




• Reckenstein, Bernhard, Prof. Dr. 


(30) Priorrtat: 09.07.1997 DE 19729211 


91369 Wiesenthau (DE) 


11.02.1998 DE 19805371 


• Ensser, Armin, Dr. 




90419 Nurnberg (DE) 



(54) Humanes und murines Semaphorin L 

(57) Humanes Semaphorin L(H-SemaL) und korre- 
spondierende Semaphorine in anderen Spezies. 

Gegenstand der Erfindung sind neuen Semapho- 
rine, die sich durch eine besondere Dom^nenstruktur 
auszeichnen und deren Derivate. NuWeinsSuren (DNA. 
RNA, cDNA). die fiir diese Semaphorine kodieren und 
deren Derivate sowie die Verwendung derselben. 

Gegenstand der vorliegenden Erfindung sind Sem- 
aphorine mit einer neuen, bisher nicht bekannten und 
nicht zu envartenden Dom^nenstruktur, denen eine bio- 
chemische Funktion im Immunsystem zukommt 
(immunmodulierende Semaphorine). Die erfindungs- 
gemSBen Semaphorine werden als Semaphorine vom 
Typ L (SemaL) bezeichnet. Sie enthalten ein N-termina- 
les Signalpeptid, eine charakteristische Sema-Domane 
und im C-terminalen Bereich des Proteins eine Immun- 
globulin-ahnliche DomSne urxl eine hydrophobe 
DomSne, die eine potentielle TransmembrandomSne 
darsteltt. 
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Europaisches 
Patentamt 



EUROPAISCHER RECHERCHENBERICHT 



Nummer der Anmeldung 

EP 98 11 2470 



Kategorie 



D.A 



EINSCHLAGIGE DOKUMENTE 



Kemzeichnung des Dokuments mit Angabe. soweit ertorderlich. 
der maOgeblichen Telle 



Homo sapiens 
to SP:A49069 



ENSSER A ET AL: "Alcephaline herpesvirus 
type 1 has a semaphorin-1 ike gene" 
JOURNAL OF GENERAL VIROLOGY., 
Bd. 76, 1995, Seiten 1063-1067, 
XP0021 13888 

SOCIETY FOR GENERAL MICROBIOLOGY, 
READING., GB 
ISSN: 0022-1317 

* Abbildung 2 * 

DATABASE EMBL 'Online! 
Accession Number H03806, 
22. Juni 1995 (1995-06-22) 
HILLIER L ET AL: ••yj39f01.rl 
cDNA clone 151129 5' similar 
A49069 COLLAPSIN - ; " 
XP002125533 

* 94% identitat (420 BP) zwischen SEQ ID 1 
und H03806 * 

DATABASE EMBL 'Online! 

accession number AA260340, 

19. Marz 1997 (1997-03-19) 

MARRA M ET AL: "va91b02.rl Soares mouse 

3NME12 5 Mus musculus cDNA clone 746763 5' 

similar to TR:61000717 G1000717 SIMILAR TO 

GENBANK ACCESSION NUMBER L26081. ; " 

XP002125534 

* 99.7% Identitat (347 BP) zwischen SEO ID 
1 und H03806 * 

-/- 



Betritft 
Anspfuch 



1,3,5,6 
8,11 



KLASSIFIKATION OER 
ftNMELOUNG (Int.CI.S) 



C12N15/12 

C07K 14/47 
A6 IK 48/00 
G01N33/50 



Der vorliegende Recherchenbericht wurde fur alle Paientanspruche ersieiit 



Recherctienon 

DEN HAAG 



10. Januar 2000 



RECHERCHIERTE 
SACHGEBIETE (lnt.a.6) 



C12N 

C07K 
A61K 
GOIN 



PfOPw 

Lejeune, R 



KATEGORIE OER GENANNTEN DOKUMENTE 

: von twsondefer Bedeirtung altein beirachtet 

: von bdsonderor Bedeutung in Verbindung mit einer 

anderen Vordftenilkhung dorsolben Kategorie 

t9cnnolog>scr>er Himergrund 
: nichtschnftliche Otfenbarung 
: Zwiscnontitoratur 



T dor Eriindung zugrunde liege nde Theorten Oder Grurxteatze 
E allures Patentdokument. das jedoch erst am oder 
nach dam ArwT>e(d©datum verbffentlicht worden ist 
0 in der Anmefdur^g angefuhrtes Ookument 
L : aus arxleren Grunden angefuhrtes Ookument 

& Mitgtied <ler gieicben Pa terTttamHie.ube reins I immendes 
Ookument 



EP 0 892 047 A3 



Europdisches 
Patentamt 



EUROPAISCHER RECHERCHENBERICHT 



Nummer def Anmeldung 

EP 98 11 2470 



EINSCHLAGIGE DOKUMENTE 



Kategofie 



Kennzetchnung des Dokuments mit Angabe. sowett ertofderlich, 
def maBgeblichen Teile 



YAMADA A ET AL: "Molecular cloning of a 

g1 ycosyl phosphat i dyl i nos i tol -anchored 

molecule COwlOS" 

JOURNAL OF IMMUNOLOGY. , 

Bd. 162, 1. April 1999 (1999-04-01), 

Seiten 4094-4100, XP002123609 

THE WILLIAMS AND WILKINS CO. BALTIMORE 

US 

ISSN: 0022-1767 

* 99.8% Identitat zwischen SEQ ID 1 und 
C0W108 (Abblldung 1) » 

* 3e1te 4094, Spaite 2, Absatz 2 

LANGE C ET AL: "New eukaryotic 
semaphorlns with close homology to 
semaphorins of viruses" 
GENOMICS, 

Bd. 51, 1. August 1998 (1998-08-01), 
Seiten 340-350. XP002113887 
SAN DIEGO. , US 
ISSN: 0888-7543 

* 99.8% identitat zwischen SEO ID 1 und 
H-Sema-L (Abblldung 3) * 

-4 DATABASE EMBL 'Online! 

Accession Number AF030699, 

8. September 1998 (1998-09-08) 

LANGE C ET AL: "Mus musculus semaphorin L 

(SemaL) mRNA, partial cds." 

XP002125537 

* M-SemaL ist identisch zu SEQ ID 1 * 

-/-- 



Betriftt 
Ansprucft 



KLASSIFIKATTON OER 
ANMELDUNG (lnt.CI.6) 



1-3,5-9 

11.12, 

18-20 



Der voftiegende Rechefchenberichl wurde fur alte Patenlanspruche erstelU 



1-12,18 



RECHERCHIERTE 
SACHGEBIETE (lnt.Cl.6) 



Rech«rcherKHt 

OEN HAAG 



AbscrtiiJdatum dei Recftercrw 

10. Januar 2000 



Prtrfftf 

Lejeune, R 



KATEGORie DER GENANNTEN DOKUMENTE 

X : von besonderer Bedeutung alletn betrachtet 

Y : von besonderer Bedeutung in Verbindung mit einer 

anderen Veroffontlichung derselbon Kategorw 
A ; technologischGr Hintergrund 
O : rttchtschrittlicho Oftentoarung 
P : Zwidchenliteratur 



T : der Ertindurtg zugrunde liegende Theofien odef Grundsatze 
E : atteres Paten tdokument. das jedocti erst am odef 
nach dem AnmeWedatum verdffentlicht worden ist 
D ; in dor AnmekJung angefuhrtes Dokument 
L : aus anderen Grunden angetuhrtes Dokument 



& : Mttgtied def gleichen Palentfamriie.Ubereinslimmendoa 
Dokument 



EP 0 892 047 A3 



Europdisches 
Patentamt 



EUROPAISCHER RECHERCHENBERICHT 



Nummer der Anmeldun^ 

EP 98 11 2470 



Kategorie 



EINSCHLAGIGE DOKUMENTE 



Kennzeichnung des Ookumenis mit Angabe. soweit erforderlich 
der tnaOgeblichen Telle 



XU X ET AL: "Human semaphorin Kl is 
glycosylphosphatidylinositol-l inked and 
defines a new subfamily of viral-related 
semaphorins" 

JOURNAL OF BIOLOGICAL CHEMISTRY. , 
Bd. 273. Nr. 35. 

28. August 1998 (1998-08-28), Seiten 
22428-22434, XP0021 13886 
AMERICAN SOCIETY OF BIOLOGICAL CHEMISTS 
BALTIMORE, HD., US 
ISSN: 0021-9258 

* 99.1% identitat zwischen SEQ ID 1 und 
Sema Kl (Abbildung I) * 

WO 99 45114 A (ZYMOGENETICS INC) 
10. September 1999 (1999-09-10) 

* 99.8% identitat zwischen SEQ ID 1 und 
SEC ID 1 von W0994S114) * 

* Beisplel 4 * 

WO 99 38885 A (SMITHKLINE BEECHAM PLC) 
5. August 1999 (1999-08-05) 

* 99.9% identitat zwischen SEQ ID 1 und 
SEQ ID 1 von W09938885 ♦ 

WO 99 58676 A (SPRIGGS MELANIE K ;IMMUNEX 
CORP (US)) 18. November 1999 (1999-11-18) 

* 99.95% Identitat zwischen SEQ ID 1 und 
SEQ 10 1 von W09958676 * 

-/-- 



Oer vorliegende Recherchenbericht wurde fOr alle PatentansprOche erstellt 



Betrim 
Anspruch 



1-3,5-9, 
11,12,18 



KLASSIFIKATION OER 
ANMELOUNG (lnt.CI.6) 



1-3,5-9, 
11,12, 
18-20 



1-3,5-9, 
11,12,18 
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